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武松 〈 松 哥 统 计 ) ， 安 徽 中 医药 大 学 副教授 ， 中 国 疾病 预防 控制 中 心 流行 病 与 卫生 
统计 学 博士 ， 世 界 中 联 临床 科研 统计 学 会 理事 ， 国 家 高 级 统计 分 析 师 ，SPSS 高 级 数据 
分 析 师 ， 微 信 公 众 号 精 里 统计 (data973) 创始 人 。 擅 长 SPSS、SPSS-Modeler、SAS、 
Stata、Revman 等 多 种 统计 软件 ， 国 内 多 家 杂志 统计 专业 审 稿 人 员 ， 目 前 主持 课题 8 项 ， 
协作 子 课题 11 项 ， 出 版 SPSS 专著 1 部 ， 另 外 以 副 主编 的 身份 参与 编写 了 8 部 图 书 ， 参 
与 过 “十 一 五 ”“ 十 二 五 ”“ 国 家 自然 基金 ”“ 卫 生 部 专项 基金 ”等 百 余 项 课题 数据 分 
析 。 在 国家 级 刊物 以 第 一 作者 或 通讯 作者 发 表 文章 40 余 扁 ， 其 中 SCLMedline 收录 5 篇 ， 
获得 国家 发 明 专 利 1 项 ， 获 得 上 海 市 出 入 境 检验 检疫 局 科技 兴 检 三 等 奖 1 项 。 近 年 致力 
于 数据 分 析 与 挖掘 技术 的 研究 与 推广 ， 举 办 SPSS 数据 培训 近 百 场 ， 培 训 风 格 幽默 风趣 ， 
化 复杂 难 懂 的 统计 于 举例 与 比喻 之 中 ， 是 业界 最 受 欢 迎 的 SPSS 统计 讲师 之 一 。 主 编 的 
《SPSS 统计 分 析 大 全 》 一 书 累 计 印 刷 15 次， 销量 4 万 多 册 ， 梭 中 多 个 图 书 销售 网 站 统 
计 软 件 类 图 书 榜首 。 


终于 鼓 起 勇气 ， 准 备 独自 撰写 一 本 SPSS 实用 教程 。 教 书 18 载 ， 看 见 太 多 的 学 生 、 
教师 及 相关 科研 工作 者 为 统计 分 析 而 发 悉 。 我 也 经 常 纳 疗 ， 咀 们 本 科 生 、 研 究 生 及 博士 
生 阶段 都 学 习 了 统计 ， 为 什么 一 到 用 时 就 慰 镶 失措 呢 ? 这 其 中 必然 有 教师 和 学 生 两 方面 
的 原因 ， 教 师 应 付 教学 ， 学 生 应 付 考试 ， 但 归根 结 底 还 是 统计 老师 的 原因 。 

里 然 古人 告诉 我 们 “不 仅 要 知 其 然 ， 还 要 知 其 所 以 然 ”, 但 是 松 哥 对 此 表示 不 同意 ， 
在 科技 凤 展 如 此 迅猛 的 今天 ， 我 们 能 够 知 其 然 已 属 不 易 ， 知 其 所 以 然 已 不 可 能 。 比 如 手 
机 已 经 成 为 我 们 生活 的 一 部 分 ， 咱 们 会 用 就 可 以 了 ， 何 必 追 究 其 工作 原理 ， 除 非 通信 和 就 
是 你 的 研究 专业 。 对 于 统计 学 习 ， 松 哥 一 直 提倡 实战 主义 ， 因 为 需要 数据 分 析 的 绝 大 多 
数 用 户 都 是 非 统 计 专 业 人 士 ， 过 多 的 学 习 和 和 潮 握 统计 学 的 公式 推导 ， 就 已 将 非 统 计 专业 
人 士 的 精力 消耗 列 尽 ， 面 对 后 续 分 析 的 学 习 ， 已 经 没有 继续 的 勇气 。 所 以 对 于 初学 者 ， 
如 果 能 用 简明 形象 的 语言 传授 其 统计 的 思想 ， 然 后 以 实际 案例 进行 分 析 与 解读 ， 其 效果 
将 远 胜 于 前 者 。 正 所 谓 : 为 伊 消 得 人 惟 翌 ， 一 用 就 错 学 不 会 ， 舍 得 应 付 换 应 用 ， 案 例 实 
战 真 英雄 。 

鉴于 此 ， 松 哥 立 意 写 一 本 没有 统计 公式 的 统计 分 析 与 SPSS 实战 教程 ， 一 些 统计 思 
想 与 理论 尽量 用 一 些 白 话 方式 进行 表达 。 思 想 阐明 以 后 ， 就 以 实际 案例 进行 案例 分 析 ， 
SPSS 实战 操作 与 结果 的 详细 解读 。 其 实 松 哥 在 2014 年 曾 出 过 一 本 《SPSS 统计 分 析 大 全 》， 
销量 很 好 ， 出 版 性 已 经 多 次 加 印 ， 但 回头 看 还 有 很 多 地 方 不 太 完 善 ， 甚 至 今天 松 哥 对 当 
时 的 写作 思路 都 开始 否定 。 于 是 决定 ， 重 新 撰写 一 本 《SPSS 实战 与 统计 思维 》， 这 是 一 
个 疯狂 的 、 目 虐 式 的 决定 ， 松 哥 给 目 己 一 年 的 时 间 ， 将 目 己 的 经 验 与 心得 呈现 在 读者 的 
面前 ， 松 哥 相 信 这 会 是 一 本 值得 收藏 的 好 书 ! 

本 书 分 为 六 个 篇 章 进行 讲述 ， 第 一 篇 : 统计 思维 ; 第 二 篇 : SPSS 数据 库 构 建 与 数据 
管理 ;第 三 篇 : 初级 统计 说 一 说 (描述 性 统计 ); 第 四 篇 : 中 级 统计 比 一 比 (差异 性 分 析 ); 
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第 五 篇 : 高 级 找 关 系 ( 统 计 模 型 ); 第 六 篇 : 专项 统计 。 本 书 定位 是 一 本 初学 者 的 入 门 宝典 ， 
中 级 用 户 的 提升 指南 , 高 级 用 户 的 拓展 手册 。 本 书 发 行 后 会 继续 征集 读者 意见 , 修订 完善 ， 
最 终 成 为 一 本 SPSS 学 习 的 红 宝 书 ! 

本 书 得 到 安徽 省 教育 厅 重 点 研究 项 目 (2015jyxm186) 、 安 徽 中 医药 大 学 教学 研究 课 
题 (NO.YB201012) 和 (2013xjzc012) 资助 ， 特 此 感谢 。 

写 书 是 无 比 艰辛 的 ,给 自己 一 个 目标 , 在 岁月 的 河流 中 , 留 下 活 过 的 印记 ! 立 字 为 据 ! 


松 哥 统计 
2017 年 5 月 21 日 
于 安徽 合肥 
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一 一 【法 】 黎 卡 儿 


统计 学 习 分 为 统计 思想 学 习 与 统计 方法 学 习 两 个 部 分 。 统 计 思 想 是 统计 之 道 ， 统 计 
方法 是 统计 之 术 。 无 道 之 术 狂 如 脱 缉 野 马 ， 无 术 之 道 犹如 空中 楼 阔 ， 良 术 背 后 必 有 道 ， 
道 术 兼 修 方 可 大 成 。 


统计 思想 亦 为 统计 之 魂 ， 统 计 方 法 可 为 统计 之 左 ， 现 之 左 之 基 ， 绕 之 瑰 所 依 ， 无 瑰 
似 野 尸 ， 无 绒 则 游 魂 。 魂 绒 分 之 两 所 弃 ， 合 则 人 之 灵 。 


统计 之 道 ， 学 之 苦涩 ， 佳 境 难 ， 需 悟 之 ; 统计 之 术 ， 学 之 甘 靡 ， 提 升 快 ， 可 速成 ; 
故 几 者 多 萄 追逐 统计 之 术 ， 统 计 之 道 常 轻 之 ， 故 常 第 得 法 不 得 道 ， 每 途 实 战 之 时 ， 反 而 
乱 了 阵脚 ， 浑 身 统计 之 术 ， 不知 使 出 哪 招 方 可 玻 敌 千里 。 


故 统计 学 习 道 术 不 可 偏 度 ， 道 先行 ， 术 跟 上 ， 思 之 先 ， 践 之 后 ， 是 谓 本 书 之 始 ， 统 
计 思 维 也 1 


核心 统计 概念 


统计 学 是 处 理 复杂 科学 问题 的 艺术 , 概念 是 思维 的 基本 单位 , 是 思维 的 出 发 点 和 终点 。 
统计 概念 为 统计 的 基石 ， 一 些 统计 核心 概念 的 掌握 将 会 促进 初学 者 对 统计 思维 的 理解 与 
学 习 ! 本 章 重 点 讲解 一 些 核 心 的 统计 概念 ， 其 他 概念 会 在 相关 章节 讲解 。 


> 1.1 总 体 与 样本 ( population and sample) 


1.1.1 已 1 


总 体 是 指 根 据 研究 目的 所 确定 的 观察 单位 某 项 特征 的 集合 。 比 如 说 我 想 研究 安徽 中 
医药 大 学 所 有 在 校生 的 平均 体重 ， 那 根据 此 目的 ， 我 们 研究 的 总 体 就 是 ， 安 徽 中 医药 大 
学 所 有 在 校生 的 体重 数据 的 集合 。 但 是 需要 注 明 一 点 :总体 分 为 有 限 总 体 和 无 限 总 体 ， 
上 面 的 例子 就 是 有 限 总 体 ， 毕 竟 安 徽 中 医药 大 学 的 学 生还 是 有 限 的 ， 然 而 科研 过 程 中 面 
临 的 大 多 数 是 无 限 的 总 体 ， 如 茫茫 宇宙 中 星体 的 平均 质量 ， 如 空气 中 某 种 物质 的 浓度 ， 
我 们 是 无 法 取得 其 总 体 进行 研究 的 。 那 我 们 面 对 无 限 总 体 怎么 办 呢 ? 

中 国 古 话 云 ， “君子 性 非 异 也 ， 善 假 于 物 也 。” 大 意 是 聪明 的 人 并 不 是 本 质 上 与 一 
般 人 就 不 一 样 ， 只 不 过 善于 利用 某 种 工具 罢了 。 因 此 ， 我 们 为 了 研究 无 限 总 体 ， 发 明了 
抽样 的 方法 ， 就 像 我们 想 知道 一 锅 老 母 鸡汤 的 成 淡 ， 不 需要 喝 完 所 有 的 汤 ， 只 要 摇 匀 ， 
尝 其 一 勺 就 可 以 了 ， 这 种 思想 就 叫 “抽样 ”。 


1.1.2 样本 


样本 就 是 从 总 体 中 抽出 的 部 分 观察 单位 某 项 特征 的 集合 。 但 是 在 抽样 过 程 中 必须 遵 
守 随 机 化 的 原则 。 我 们 通常 都 是 通过 研究 样本 去 推断 研究 总 体 的 属性 与 特征 。 
生活 中 处 处 存在 抽样 的 思想 ， 如 “一 叶 知 秋 ”“ 豹 蜂 一 班 ”、3。15 质量 抽检 报告 等 。 


地 1.2 参数 与 统计 量 ( parameter and statistics ) 


参数 是 用 于 描述 总 体 特征 的 指标 ， 如 总 体 均 数 (1) ， 忆 体 标准 差 (o) 、 忆 体 率 (7X) 、 
忆 体 相关 系数 (p) 。 
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统计 量 是 用 于 描述 样本 特征 的 指标 , 如 样本 均 数 (XY) , 样本 标准 差 (s)、 样 本 率 (p)、 
样本 相关 系数 (r) 。 

一 般 而 言 ， 我 们 进行 科学 研究 直接 获取 到 的 仅 是 样本 的 统计 量 而 已 ， 可 是 我 们 的 研 
完 目的 却 是 想 获知 总 体 的 属性 特征 ， 即 总 体 参数 。 统 计 学 存在 的 核心 价值 就 在 于 可 以 通 
过 描述 样本 的 统计 量 去 推断 描述 总 体 的 参数 ， 这 是 通过 偶然 去 发 现 必 然 、 通 过 一 般 去 发 
现 普 忆 ， 这 是 以 小 见 大 的 过 程 。 参 数 与 统计 量 的 关系 如 图 1-1 所 示 。 


图 1-1 统计 四 概念 关系 


叶 1.3 概率 与 频率 ( probability and frequency ) 


1.3.1 概率 


概率 (PP) 是 用 于 反映 某 一 事物 发 生 可 能 性 大 小 的 一 种 量度 ,一 般 用 大 写 的 斜体 PP 表示。 

我 们 根据 事物 发 生 概率 的 大 小 ， 把 事件 分 为 3 类 : 记 1 为 必然 事件 ， 发 生 率 为 
100%; P=0 为 不 可 能 事件 ， 发 生 率 为 0; 0<P<1 为 偶然 事件 ， 在 事件 未 进行 之 前 ， 其 既 
可 能 发 生 ， 也 可 能 不 发 生 。 其 中 忆 志 0.05 或 PP 0.01 的 事件 为 小 概率 事件 ， 其 实际 应 
用 意义 为 在 一 次 试验 、 抽 样 或 研究 过 程 中 不 可 能 发 生 。 


小 概率 事件 非常 重要 ， 是 统计 推断 的 基础 ， 松 哥 举 个 例子 : 统计 起 源 于 赌博 游戏 ， 
中 们 虚构 一 个 游戏 ， 在 一 个 不 透明 的 箱子 中 有 100 个 乒乓 球 ， 其 中 5 个 是 黄色 的 ，95 
个 是 白色 的 ， 现 在 在 一 个 100 名 学 生 的 班级 中 ， 请 大 家 每 人 上 来 交 1 元 钱 ， 然 后 随机 
抽取 一 个 球 ， 如 果 抽 中 黄 球 给 10 元 ， 抽 不 中 就 谢谢 参与 ， 请 问 你 是 抽 呢 ， 还 是 不 抽 呢 ? 
Mp] lp] ! 

基于 统计 的 判断 ， 你 是 不 该 抽 的 ， 为 什么 呢 ?” 因 为 黄 球 所 占 的 比例 为 0.05， 是 小 概 
率 事件 ， 而 小 概率 事件 的 应 用 意义 为 在 一 次 抽样 过 程 中 发 生 的 概率 为 0， 因 此 ， 你 基本 
不 可 能 抽 中 , 然而 小 概率 事件 在 一 次 抽样 过 程 中 发 生 概 率 为 0, 但 在 群体 事件 中 可 以 发 生 ， 
本 例 发 生 概 率 为 5%， 班 上 100 名 同学 ,理论 上 有 5 名 同学 可 以 抽 到 。 算 一 下 ,每 人 1 元 ， 
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共 收 到 100 元 ， 减 去 $ 名 抽 中 的 奖金 50 元 ， 松 哥 还 稳 赚 50 元 呢 。 
1.3.2 频率 


频率 (f) 是 指 我 们 进行 了 NN 次 试验 ， 其 中 一 个 事件 出 现 的 次 数 m 与 总 的 试验 次 数 N 
的 比值 。 

问题 是 : 统计 是 基于 概率 说 话 的 ,我 们 到 底 如 何 才能 够 得 到 某 一 事件 发 生 的 概率 呢 ， 
比如 说 谁 能 够 告诉 我 一 支 半 截 粉 笔 从 讲台 上 掉 下 摔 断 的 概率 尸 是 多 大 呢 ? 我 们 至 今 的 科 
学 发 展 也 没有 办 法 通过 公式 去 计算 该 值 。 那 我 们 是 怎么 做 的 呢 ? 有 人 句 话 叫 作 “ 有 些 事情 
越 想 越 烦 ， 做 起 来 却 极其 简单 ”。 我 们 只 需要 拿 两 合同 样 的 粉笔 进行 重复 摔 就 可 以 了 ， 
如 果 总 共 100 支 粉笔 ， 断 了 98 文 ， 那 断 的 频率 就 等 于 广 98/100=0.98。 而 统计 学 上 证 实 ， 
当 某 事件 发 生 次 数 较 多 时 ， 频 率 就 会 收敛 于 概率 ， 意 即 记 P。 因 此 ， 其 实 我 们 就 是 通过 
频率 去 估计 概率 的 。 

你 可 以 这 样 理解 : 频率 是 针对 过 去 的 ， 概 率 是 针对 未 来 的 。 频 率 是 针对 已 经 发 生 的 
样本 的 ， 概 率 是 针对 尚 不 知晓 的 总 体 的 ， 频 率 就 像样 本 统计 量 ， 概 率 更 像 总 体 参 数 ， 而 
我 们 是 用 频率 去 估计 概率 的 。 


> 1.4 误差 (error ) 


误差 是 观察 值 与 真 值 之 差 ， 即 我 们 通过 一 次 试验 得 到 的 结果 与 事件 真实 结果 之 间 的 
差 值 。 误 差 根据 其 产生 的 原因 分 为 四 种 。 

1. 系统 误差 (systematic error) 

系统 误差 是 因为 试剂 未 校正 或 者 仪器 没有 调和 零 等 因素 造成 的 研究 结果 倾 回 性 的 增 大 
或 减 小 。 如 我 们 路 过 药房 ， 门 口 放 置 一 个 体重 计 ， 请 问 我 们 在 称 自己 的 体重 之 前 ， 首 先 
要 干 的 第 一 件 事情 是 什么 呢 ? 有 同学 说 先 把 手 上 的 包 放 掉 ， 有 同学 说 把 鞋子 脱 掉 ， 还 有 
同学 说 我 看 看 是 不 是 要 收费 的 再 说 ， 了 呵呵 ! 但 从 统计 学 角度 ， 我 们 应 该 看 看 体重 计 上 的 
指针 是 不 是 对 准 零 ， 如 果 体 重 计 本 身 就 有 5kg 底 重 ， 那 我 们 所 有 的 同学 去 称 ， 都 将 会 重 
5kg， 即 发 生 倾 同性 的 偏 大 。 系 统 误差 其 特点 为 : 倾 回 性 的 增 大 或 减 小 ， 可 以 避免 ， 如 果 
我 们 进行 调 零 ， 系 统 误差 就 可 以 避免 。 

2. 随机 误差 (random error) 

随机 误差 是 由 各 种 偶然 因素 造成 的 观察 值 与 真 值 之 差 。 比 如 某 班 级 所 有 同学 用 同一 
把 尺子 测量 松 哥 的 身高 ， 结 果 发 现 我 的 身高 值 是 不 一 样 的 。 随 机 误差 的 特点 为 : 不 可 以 
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避免 ， 但 可 以 减少 。 统 计 学 有 一 定律 叫 作 “ 测 不 准 定 律 ”， 不 管 你 怎么 测 ， 就 是 测 不 准 ， 
那 对 于 重要 的 指标 我 们 怎么 办 呢 ? 正如 网 上 流行 的 一 句 话 “ 重 要 的 事情 说 三 遍 ”， 那 么 
我 们 对 重要 的 指标 ， 就 多 测 几 遍 唆 ! 

3. 抽样 误差 (sampling error) 

抽样 误差 是 因为 抽样 造成 的 样本 统计 量 与 总 体 参数 之 间 的 差异 。 有 同学 肯定 会 说 ， 
刚才 那 一 勺 老 母 鸡汤 的 咸 淡 应 该 和 锅 里 汤 的 咸 淡 是 完全 一 样 的 啊 ! 是 的 ， 刚 才 的 例子 是 
让 你 明白 抽样 的 原理 ， 而 我 们 科学 研究 和 喝 老 母 鸡汤 是 不 一 样 的 ， 因 为 汤 里 的 氧化 钠 是 
均匀 分 布 的 ， 而 我 们 科学 研究 的 目标 事件 是 不 均匀 分 布 的 。 比 如 某 个 班级 120 名 同学 的 
近视 眼 患 病 率 为 50%， 松 哥 按 照 随 机 化 原则 随机 抽取 50 名 同学 ， 这 50 名 同学 的 近视 眼 
患 病 率 理论 不 会 等 于 50%， 因 为 近视 眼 同学 在 班级 中 的 分 布 是 不 均匀 的 ， 能 理解 吧 ! 因 
此 抽样 误差 的 特点 为 : 不 可 以 避免 ， 但 可 以 减少 ， 我 们 可 以 通过 增 大 样本 量 进行 减少 ， 
可 以 看 图 1-2 帮助 理解 哦 。 


图 1-2 ”均匀 分 布 与 不 均匀 分 布 


4. 过 失误 差 (gross error) 

过 失误 差 是 由 于 观察 过 程 中 的 不 仔细 造成 的 错误 判断 或 记录 。 过 失误 差 可 以 通过 仔 
细 核 对 避免 。 

那么 统计 学 的 存在 ， 主 要 是 解决 哪 种 误差 呢 ? 我 们 通过 统计 设计 减少 系统 误 送 ， 通 
过 统计 学 检验 去 排除 抽样 误差 。 测 量 误差 不 可 避免 ， 可 以 通过 培训 降低 ， 过 失误 差 可 以 
通过 质量 控制 消除 。 
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> 1.5 同 质 与 变异 ( homogeneity and variation ) 


1.$.1 同 质 

指 观 察 单位 所 受 的 影响 因素 相同 。 而 我 们 科研 的 观察 单位 所 受 的 影响 因素 只 
可 能 相对 的 相同 ， 不 可 能 绝对 的 相同 ， 因 此 ， 同 质 是 相对 的 。 我 们 科研 所 确定 的 总 体 或 
者 样本 ， 在 某 些 因素 上 必须 是 同 质 的 ， 只 有 这 样 我 们 才能 将 其 作为 一 个 群体 进行 研究 。 


1.5.2 变异 


变异 是 指 观察 单位 在 同 质 基 础 上 的 个 体 差异 。 很 多 哲 言 或 谚语 都 在 说 明 变 异 的 存在 ， 
如 天 底下 没有 两 片 完全 一 样 的 树叶 ;一 个 人 不 可 能 两 次 踏 入 同一 条 河流 ;刚才 说 话 的 我 
已 经 不 是 现在 说 话 的 我 了 ; 天 下 唯一 不 变 的 就 是 变化 。 因 此 ， 变 异 是 绝对 的 。 

这 一 对 概念 对 研究 统计 的 意义 : 如 果 没 有 同 质 ， 就 没有 我 们 研究 的 总 体 或 者 样本 。 
因为 如 果 不 同 质 ， 我 们 是 不 可 能 把 他 们 放 在 一 起 进行 研究 的 。 如 果 没 有 变异 ， 就 根本 没 
有 统计 学 产生 的 必要 ， 因 为 如 果 没 有 变异 ， 我 们 拿 1 种 药物 治疗 茶 病 的 1 个 病人 ， 如 果 
有 效 ， 该 药 对 所 有 患 该 病 的 病人 者 应 该 有 效 ， 而 那 是 不 可 能 的 。 因 为 人 与 人 之 间 的 变异 
性 是 绝对 存在 的 ， 对 你 有 效 ， 对 我 却 未 必 有 效 ， 而 统计 学 就 是 在 群体 的 水 平 上 去 发 现 事 
物 背 后 的 本 质 与 规律 的 。 


> 1.6 随机 化 原则 ( random principle ) 


随机 化 原则 是 指 我 们 在 选择 受 试 对 象 、 对 受 试 对 象 分 组 以 及 对 受 试 对 象 施加 不 同 的 
干预 措施 时 ， 受 试 对 象 被 抽 到 的 概率 、 被 随机 分 到 各 组 的 概率 以 及 接受 不 同 干预 措施 的 
概率 是 相等 的 。 统计 学 中 随机 化 的 具体 体现 包括 随机 化 抽样 、 随 机 化 分 组 和 随机 化 顺序 。 
三 种 随机 化 的 模式 见 图 1-3。 

随机 化 抽样 是 指 我 们 从 研究 总 体 中 抽取 研究 样本 时 ， 总 体 中 的 任何 一 个 个 体 被 抽 到 
作为 样本 进行 研究 的 概率 相等 。 

随机 化 分 组 是 指 我 们 获取 研究 样本 后 ， 样 本 中 的 每 个 受 试 对 象 具 有 同等 的 机 会 被 分 
吧 到 各 个 研究 组 中 去 。 

随机 化 顺序 是 指 当 我 们 进行 交叉 试验 时 ， 随 机 化 分 组 后 的 研究 组 接受 不 同 干预 措施 
的 顺序 是 随机 的 。 
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A: 随机 化 抽样 ，B: 随机 化 分 组 ; C: 随机 化 顺序 


> 1.7 因素 与 水 平 ( factor and level ) 


1.7.1 ”因素 
因素 是 可 能 对 应 变量 有 影响 的 变量 ， 而 分 析 的 目的 就 是 比较 不 同 水 平 对 应 变量 的 影 


啊 是 否 相同 。 如 性 别 可 能 对 性 格 有 影响 ， 性 别 此 时 就 是 因素 ;而 性 格 可 能 对 茶 种 疾病 有 
影响 ， 此 时 性 格 就 是 因素 了 。 攻 个 变量 到 底 是 不 是 研究 因素 ， 是 由 研究 目的 确定 的 ! 


1.7.2 ”水 平 


因素 的 不 同 取 值 等 级 称 作 水 平 ， 例 如 ， 因 素性 别 有 男 、 女 两 个 水 平 ， 血 型 有 A、B、 
O 和 AB 型 4 个 水 平 。 水 平 往往 是 统计 学 分 组 的 依据 。 


> 1 


变量 为 观察 单位 的 某 项 特征 ， 如 入 的 身高 、 体 重 、 性 别 、 年 龄 、 血 型 、 营 养 程度 等 ， 
通俗 讲 就 是 我 们 研究 的 指标 。 根 据 变量 特征 的 属性 ， 变 量 可 以 分 为 计量 变量 、 等 级 变量 
和 计数 变量 。 
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1.8.1 计量 变量 


计量 变量 时 通过 定量 的 方法 检测 出 来 的 指标 ， 通 常 以 阿拉 伯 数 字 呈 现 ， 具 有 单位 ， 
并 可 以 定量 地 比较 ， 如 身高 (cm) 、 体 重 (kg) 、 血 压 (mmHs) 、 脉 搏 (次 /分 ) 、 工 资 、 
年 龄 等 。 计 量变 量 支 持 加 减法 (十 /-) 运算 。 计 量变 量 很 多 书 上 又 称 为 数值 变量 ， 连 续 


性 变量 ， 定 量变 量 。 
1.8.2 ”计数 变量 


计数 变量 反映 的 是 互 不 相 容 的 属性 和 类 别 , 反 映 的 是 一 种 我 中 无 你 你 中 无 我 的 天 系 。 
常 通过 计数 的 方式 获得 ， 如 血型 (A、B、O 和 AB) 、 性别 ( 男 、 女 ) 、 和 生肖 属 相 、 民 族 等 。 
计数 变量 之 间 支 持 不 等 号 〈( 隆 )。 计 数 变 量 又 称 为 分 类 变量 ， 无 序 分 类 变量 。 


1.8.3 ”等 级 变量 


等 级 变量 具备 计数 变量 的 性 质 , 同时 又 具有 半 定 量 比较 的 性 质 , 如 病情 ( 轻 、 中 、 重 )、 
职称 〈 初 级 、 中 级 、 高 级 ) 、 学 历 (文盲 、 小 学 、 中 学 、 本 科 及 以 上 ) 、 福 利 待 遇 (好 、 
中 、 差 ) 。 这 类 变量 各 水 平 之 间 互 不 相 容 ， 但 又 有 级 别 上 的 轻重 关系 。 等 级 变量 支持 大 
eh 

1.8.4 ”变量 之 间 相 互 转换 

同一 受 试 对 象 身上 可 以 检测 出 上 述 的 三 种 变量 ， 三 种 变量 反映 受 试 对 象 信息 的 能 力 
顺序 依次 为 计量 变量 、 等 级 变量 和 计数 变量 。 为 了 方便 大 家 记忆 ， 我 们 把 三 种 变量 依次 
称 为 老大 、 老 二 和 老 三 。 变量 之 间 可 以 相互 转化 , 但 只 能 从 高 级 别 变量 向 低级 别 变量 转化 。 
意思 是 计量 可 以 转 为 等 级 和 计数 ， 等 级 可 以 转 为 计数 ， 但 不 可 以 道 转 。 

正如 某 医 院 的 院 长 是 老大 、 科 室 主任 是 老 二 、 科 里 的 医生 是 老 三 。 哪 一 天 这 位 院 长 
不 想 干 了 ， 他 可 以 到 科室 当主 任 、 也 可 以 当 科 员 ， 但 是 科 员 不 是 想 当 主 任 、 想 当 院 长 就 
能 当 的 。 

从 专业 上 举 个 例子 ,如 某 人 收缩 压 180mmHsg( 计 量变 量 ), 可 以 转化 为 等 级 变量 (高 
血压 、 正 常 、 低 血压 ) ， 也 可 以 转化 为 计数 变量 正常、 异常 ) ， 但 是 如 果 我 只 告诉 你 ， 
松 哥 的 血压 不 正常 ， 你 是 无 法 知道 我 是 高 是 低 ， 以 及 具体 血压 数值 的 。 这 点 也 给 我 们 一 
个 启示 ， 科 研 过 程 中 尽量 去 获取 计量 资料 ， 因 为 其 信息 多 ， 而 且 可 以 转化 。 
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统计 方法 的 选择 可 以 总 结 为 15 字 口 诀 : 方法 看 变量 ， 设 计 看 类 型 ， 目 的 定 驶 坤 。 意 
思 是 选择 哪 一 类 统计 方法 首先 看 变量 到 底 属 于 我 们 前 和 面 说 的 三 种 中 的 哪 一 种 ， 然 后 决定 统 
计 方 法 ， 具 体 统计 方法 选择 哪 一 类 型 ， 得 看 设计 类 型 ， 当 然 最 终 方法 的 选择 还 得 考虑 研究 
的 目的 ， 比 如 茶 班 级 不 同性 别 两 组 大 学 生 比 较 体 重 ， 一 看 研究 指标 是 体重 ， 为 计量 变量 ， 
而 且 是 2 组 ， 基 本 就 考虑 是 上 检验 了 ， 可 是 上 检验 有 3 种 ， 到 撒 如 何 选择 呢 ? 因为 给 出 的 
不 同性 别 两 组 大 学 生 ， 男 女生 之 间 相 互 独 立 ， 因 此 本 例 应 该 选择 2 独立 样本 上 检验 〈 此 时 
数据 应 该 符合 独立 、 正 态 、 方 差 齐 ， 人 否则 还 得 换 方法 ) 。 这 个 例子 有 点 早 ， 还 没 怎么 开 


字 2.1 太 组 设计 


成 组 设计 是 一 种 将 受 试 对 象 随 机 分 组 或 者 按照 某 种 属性 特征 将 受 试 对 象 分 配 到 2 组 
或 玉 组 中 去 。 它 的 特征 为 组 间 的 受 试 对 象 相 互 独立 。 成 组 设计 模式 图 见 图 2-1 和 图 2-2。 


图 2-1 成 组 设计 一 一 2 组 模式 图 2-2 成 组 设计 一 一 组 模式 


大 家 注意 ， 统 计 学 上 存在 一 种 “2K 效应 ”， 成 组 设计 中 的 2 组 与 组 ( 玉 壹 3) ， 
虽然 设计 都 是 成 组 设计 ， 但 后 续 采 用 的 统计 分 析 方 法 是 不 一 样 的 ! 如 研究 变量 为 计量 变 
量 ,， 成 组 2 组 设计 优先 考虑 2 独立 样本 1 检验 ， 而 下 组 优先 考虑 单 因 素 设计 方差 分 析 。 


也 2.2 配 比 设计 


思 比 设计 是 指 受 试 对 象 按照 一 定 的 条 件 进行 匹配 ， 然 后 再 随机 分 组 的 方法 ， 包 括 配 
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对 设计 和 配伍 组 设计 。 
2.2.1 配对 设计 


配对 设计 见 图 2-3， 包 括 同一 组 受 试 对 象 干预 前 后 配对 〈A) ;同一 个 受 试 对 象 身 体 
不 同 部 位 配对 〈B) ; 条 件 相 同 的 2 个 受 试 对 象 配 成 对 子 , 然后 随机 分 到 2 组 中 设计 (C); 
以 及 同一 份 标本 分 别 接受 不 同 的 处 理 (D) 。 


图 2-3 配对 设计 四 种 类 型 模式 图 2-4 配伍 组 设计 四 种 类 型 模式 


2.2.2 ”配伍 组 设计 


配伍 组 设计 为 配对 设计 的 进一步 扩大 ， 如 图 2-4 所 示 ， 每 一 种 情况 都 是 对 图 2-3 的 
扩大 化 。 其 中 的 A 为 干预 前 、 中 和 后 ， 这 种 情况 当 是 单 组 设计 时 可 以 当 作 配伍 组 设计 方 
差分 析 ， 但 当 是 多 组 设计 时 ， 应 该 考虑 用 重复 测量 数据 方差 分 析 ; B 为 同一 个 受 试 对 象 
对 身体 天 个 部 位 进行 检测 ，C 为 按照 条 件 选择 天 个 受 试 对 象 构成 一 个 配伍 组 ， 然 后 配伍 
组 中 的 每 个 受 试 对 象 随 机 分 配 到 各 组 中 去 ; D 为 同一 份 标 本 采用 天 种 方法 检测 。 


> 


问 大 家 一 个 问题 ， 比 如 果园 里 一 个 男性 工人 每 小 时 单独 可 以 摘 100 个 苹果， 一 个 女 
性 工人 单独 可 以 采摘 80 个 苹果 ， 请 问 一 男 一 女 搭 档 工 作 ， 一 小 时 采摘 180 个 苹果 吗 ? 松 
哥 并 不 想 让 你 们 告诉 我 答案 ， 只 想 你 们 能 达成 一 个 共识 ， 就 是 因素 与 因素 之 间 可 能 会 发 
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生 相 互 影 响 ， 也 就 是 交互 作用 。 
同样 ， 统 计 学 当 研 究 多 因 系 的 时 候 ， 因 素 与 因素 之 间 也 可 能 发 生 交 互 作用 ， 可 是 我 
们 可 以 通过 什么 方法 进行 研究 呢 ? 本 节 的 析 因 设计 就 是 研究 交互 作用 的 一 种 方法 。 


析 因 设计 是 多 因素 多 水 平 全 面 组 合 ， 每 一 种 组 合 就 BH A 二 一 
是 一 个 研究 分 组 的 试验 设计 方法 。 试 验 设计 模式 图 见 。 用 不 用 
图 2-5。 图 中 可 见 研究 2 个 因素 ， 因 素 4 有 用 和 不 用 2 br A pe wl 
个 水 平 ， 因 素 B 有 用 和 不 用 2 个 水 平 ，2x2 全 面 组 合 ， 用 ;3.12 1.98'!401 4.56 | 
如 一 了 二 1' 2.98 303 ，，487 4.19 ， 
Sn em 和 3.11 2.00，; 4.19 4.80 

此 时 ， 我 们 可 以 进行 三 次 假设 分 别 解决 三 个 问题 ， 445 3401'794 688 
即 因素 4 有 没有 效果 、 因 素 B 有 没有 效果 ， 以 及 4xB 3.20 3.58 1 7.88 8.02 | 
0 四 0 ， -不 用 !3.90 3.11 ,18.60 6.90 | 
之 间 有 没有 交互 作用 。 析 因 设 计 是 一 种 非常 浪费 样本 量 14.30 5.02 ;16.45 6.54 | 
的 方法 ， 因 此 实际 工作 中 研究 因素 一 般 不 超过 3 个 ， 水 se ed LN 
平 数 亦 不 可 过 多 。 如 3x3x3 析 因 设计 ， 共 27 组 ， 按 昭 和 


每 组 10 只 老鼠 计算 ,270 只 老鼠 ,再 适当 扩充 一 点 以 防止 老鼠 死亡 损失 , 则 300 多 只 老鼠 ， 
这 对 于 一 个 课题 组 而 言 是 不 可 思议 的 ， 很 难保 证 这 么 多 老鼠 的 干预 措施 的 同 质 性 。 如 果 
研究 因素 较 多 ， 可 以 考虑 正 交 设计 或 者 均匀 设计 的 方法 。 


> 24 重复 测量 设计 


重复 测量 设计 是 近年 受到 重视 的 一 种 设计 ， 该 设计 是 指 对 同一 个 受 试 对 象 在 不 同 的 


测量 时 间 点 进行 重复 检测 的 设计 。 
第 一 天 第 五 天 
pp ~ 
第 一 天 第 五 天 
-AS 
图 2-6 重复 测量 数据 模式 


注意 : 重复 检测 必须 在 同一 个 受 试 对 象 上 ， 很 多 实验 取材 检测 需要 处 死 受 试 对 象 ， 


第 三 天 
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此 时 已 经 不 能 算 作 重 复 测 量 设计 。 一 句 话 ， 坚 持 住 不 能 死 ， 一 定 要 做 “ 鼠 坚 强 ”， 否 则 
应 该 当 作 析 因 设计 进行 分 析 。 


> 2.5 其 他 设计 


其 他 设计 还 包括 交叉 设计 、 正 交 设 计 、 拉 丁 方 设 计 、 藤 套 设计 、 均 匀 设 计 等 , 此 处 不 效 ， 
当 讲 到 相应 内 容 时 再 讲解 。 


任何 一 门 学 科 ， 都 有 其 定位 的 思想 ， 其 为 学 科 之 根 ， 只 有 根深 带 固 的 思想 ， 方 能 开 
出 灿烂 的 学 科 之 伦 。 统 计 学 也 不 例外 ， 以 下 5 点 统计 学 思想 可 供 参 考 。 


> 3.1 抽样 的 思想 


除非 研究 目的 非常 特殊 ， 不 然 我 们 的 研究 对 象 不 可 能 获取 到 总 体 ， 几 乎 都 是 总 体 中 
的 样本 ， 而 样本 都 是 从 总 体 中 按照 随机 化 的 原则 抽取 获得 的 。 随 机 化 抽样 是 指 根据 研究 
目的 确定 的 研究 总 体 中 任何 一 个 研究 对 象 都 要 有 同等 的 机 会 被 抽 到 作为 样本 进行 研究 ， 
从 而 推断 总 体 情况 。 

抽样 思想 的 精 散 为 化 楷 为 简 ， 化 无 限 为 有 限 ， 化 不 可 能 为 可 能 。 通 过 抽样 我 们 可 以 
获取 研究 样本 ,对 有 限 的 研究 样本 进行 研究 ， 从 而 得 到 样本 统计 量 , 进 而 推断 总 体 情况 。 


> 32 总 体 推断 思想 


样本 统计 量 是 实际 可 以 检测 获得 的 ， 可 是 我 们 却 区 间 估 计 
志 存 高 远 ， 目 的 是 研究 总 体 。 因 为 抽样 误差 的 必然 存 


数 比较 接近 。 我 们 在 一 定 误差 的 控制 下 ， 可 以 通过 样 “人 
本 统计 量 去 预测 总 体 参 数 ， 具 体 包括 两 种 方法 ， 点 值 (点 估计 ) 
估计 法 和 区 间 范 围 估计 法 ， 见 图 3-1。 图 3-1 参数 估计 模式 


扩 值 估计 认为 样本 统计 量 就 等 于 总 体 参 数 ， 忽 上 略 了 抽样 误差 ， 因 此 该 法 风险 偏 大 ， 
基本 不 用 ; 参数 估计 法 是 指 通 过 样本 统计 量 ， 去 预测 一 个 总 体 参 数 的 95% (或 90%、 
99%， 根 据 研究 目的 确定 ，95% 最 为 音 用 ) 可 信 区 间 。 

抽样 思想 与 总 体 推 朵 思 想 相 互 结合 应 用 。 只 抽样 ,不 推断 , 丧失 了 抽样 的 初 袁 .不 抽样 ， 
又 失去 了 推断 的 基础 。 
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这 3.3 及 证 法 忆 想 


反 证 法 的 思想 就 是 将 我 们 要 研究 的 问题 凝练 为 两 种 可 能 4 和 BB， 然 后 证 明 其 中 的 4 
不 可 能 发 生 ， 那 真理 就 是 。 如 一 个 警察 追逐 一 个 小 偷 至 一 个 YY 形 路 口 ， 小 偷 不 是 往 左 
上 跑 就 是 往 右 上 跑 ， 如 果 我 们 能 够 证 明 小 偷 往 左上 跑 的 概率 P<0.05， 那 么 请 问 警 察 应 
该 往 哪 边 追 昵 ? 按照 小 概率 事件 在 一 次 事件 过 程 中 不 可 能 发 生 的 规则 ， 警 察 应 该 往 右上 
去 追 。 

我 们 科研 过 程 中 ， 验 证 某 药 是 否 有 疗效 ， 我 们 将 研究 结局 分 为 两 种 可 能 ， 于 : 药物 
无 效 ; 瑟 : 药物 有 效 。 然 后 采用 对 应 的 统计 分 析 方 法 ,去 获取 也 (药物 无 效 ) 发 生 的 概率 ， 
如 果 P<0.05, 则 玉 (药物 无 效 ) 不 可 能 发 生 , 则 (药物 有 效 ) 成 立 ,。 车 P>0.05, 则 五 ( 药 
物 无 效 ) 是 可 能 发 生 的 ， 则 我 们 不 能 够 拒绝 及 ， 因 此 尚 不 能 认为 该 药 无 效 。 


> 3.4 小 概率 思想 


在 第 1 章 中 ， 我 们 已 经 学 过 小 概率 事件 ， 即 发 生 概率 P 三 0.05 或 P 三 0.01 的 事件 。 
小 概率 事件 的 应 用 意义 就 是 小 概率 事件 在 一 次 抽样 过 程 中 发 生 的 概率 为 0。 因此 ， 一 旦 
我 们 判断 出 某 事件 的 发 生 概率 P 三 0.05， 我 们 判断 该 事件 在 个 体 水 平 不 会 发 生 。 

小 概率 思想 是 统计 推断 的 核心 ， 是 统计 学 价值 的 基础 。 假 设 检验 就 是 反 证 法 与 小 概 
率 事件 思想 相 结 合 的 具体 体现 。 图 3-2 中 ， 他 爱 那 个 她 吗 ? 他 爱 你 还 是 不 爱 你 ， 用 反 证 
法 去 试 试 吧 ! 


你 根本 就 不 爱 我 ， 你 看 ] 
”她 95 次 ， 才 看 我 5 次 ! 
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> 3.5 误差 控制 思想 


尽管 可 以 采用 小 概率 事件 原理 进行 统计 推论 以 保证 推论 的 准确 性 ， 然 而 ， 如 果 整 个 
实验 或 试验 或 调查 没有 进行 很 好 的 质量 控制 ， 也 是 白搭 ， 因 此 ， 实 验 设计 必须 有 看 误差 
控制 的 思想 。 误 差 控制 可 以 具体 体现 在 “三 要 素 ” 和 “四 原则 ”上 。 同 时 假设 检验 也 会 
发 生 统计 学 I 类 和 开 类 错误 ， 统 计 分 析 时 均 需 加 以 考虑 ， 方 能 在 最 大 程度 上 推测 总 体 的 
真实 面 上 月。 统计 学 误差 包括 系统 误差 、 抽 样 误差 、 随 机 测量 误差 和 过 失误 差 ， 相 关 章 节 


合 抱 之 木 ， 生 于 毫 末 ; 九 层 之 台 ， 起 于 又 士 ; 千里 之 行 ， 始 于 足下 。 
一 一 《老子 》 


第 一 篇 类 似 于 统计 学 之 基础 ， 第 二 篇 是 SPSS 统计 软件 的 基础 ， 统 计 学 的 基础 为 统 
计 理 论 的 基础 ，SPSS 软件 的 基础 类 似 于 统计 实战 的 基础 ， 一 文 一 武 ， 学 习 之 后 ， 咱 们 就 
开始 真正 的 实战 。 


SPSS 简介 与 数据 库 构建 


4.1 SPSS 简介 


SPSS 是 全 球 领 先 的 统计 分 析 与 数据 挖掘 产品 ， 是 世界 上 应 用 最 广泛 的 专业 统计 和 数 
据 模 型 软件 之 一 ， 全 称 为 Statistical Product and Service Solutions， 是 由 美国 斯 坦 福 大 学 
的 三 位 研究 生 于 1968 年 开发 的 ;而 SAS 成 立 于 1976 年 ; Stata 成 并 于 1985 年 ; R 软件 
于 1995 年 才 开 始 研 发 ，R 语言 的 前 里 S 语言 研发 于 1989 年 ， Matlab 创立 于 1982 年 ; 
Eviews 前 身 是 1981 年 第 1 版 的 Micro TSP; Minitab INC 成 立 于 1983 年 ;微软 公司 创立 
于 1975 年 。 可 见 SPSS 是 最 早 的 一 款 专业 的 统计 分 析 软 件 。2009 年 SPSS 公司 被 IBM 收 
购 ， 目 SPSS 19.0 开始 ， 产 品名 称 更 名 为 “IBM-SPSS”。 截 至 2018 年 5 月 本 书 完稿 之 时 ， 
SPSS 已 经 发 布 25.0 版 本 。 

“易学 易 用 易 普 及 ”已 成 为 SPSS 软件 最 大 的 竞争 优势 之 一 ， 也 是 广大 数据 分 机 人 

员 对 其 偏爱 有 加 的 主要 原因 ; 而 大 量 成 熟 的 统计 分 析 方 法 、 完 善 的 数据 定义 操作 管理 、 
开放 的 数据 接口 以 及 灵活 的 统计 表格 和 统计 图 形 ， 更 是 SPSS 长 盛 不 衰 的 重要 法 宝 。 
SPSS 在 全 球 100 多 个 国家 和 地 区 有 分 支 机 构 或 合作 伙伴 ， 约 有 28 万 家 产品 用 户 ， 分 布 
于 金融 保险 证 券 、 制 造 业 、 市 场 调 研 、 政 府 税务 、 教 育 科 研 、 医 疗 卫 生 、 化 工行 业 、 零 
售 业 、 电 子 商务 等 多 个 领域 和 行业 ， 全 球 500 强 中 约 有 80% 的 公司 使 用 SPSS; 而 在 市 
场 研究 和 市 场 调查 领域 有 超过 80% 的 市 场 占 有 率 ，SPSS 是 世界 上 应 用 最 广泛 的 专业 统 
计 软 件 之 一 。 


-> 42 SPSS 24.0 安装 


登录 IBM SPSS 主页 (https: //www.ibm.com/analytics/cn/zh/technology/spss/) 可 以 获取 
下 载 试 用 版 本 ， 也 可 以 通过 百度 搜索 “SPSS 24.0” 获 取 下 载 链接 。 本 文 主要 讲解 Windows 
试用 版 如 何 安装 (MAC 版 和 Linux 版 安装 类 似 ， 不 再 讲解 ) ， 试 用 版 除了 使 用 期 限 有 限 
制 外 ， 功 能 与 正式 版 一 样 。 
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4.2.1 确定 计算 机 系统 


SPSS 24.0 分 为 32 位 系统 和 64 位 系统 版 本 ， 你 安装 前 首先 得 知道 自己 计算 机 为 何 种 
系统 。 你 可 以 在 计算 机 桌面 找到 “计算 机 ”图 标 ， 然 后 右键 一 属性 ， 即 可 查看 。 

注意 : 64 位 的 计算 机 系统 可 以 安装 32 位 的 软件 ，32 位 系统 不 可 以 安装 64 位 软件 ， 
但 最 好 版 本 一 致 ， 使 用 才 会 更 加 顺畅 。 


4.22 安装 步骤 


点 击 SPSS 24.0 安装 图 标 ， 安 装 过 程 的 所 有 界面 如 图 4-1 一 图 4-12 所 示 ， 按 图 操作 
即 可 ， 没 有 特别 之 处 。 


a Le A Evyy 
, | Fa a - 
因 下 出 ; -atlstios 4 
M 2 _ 


pe Fa 欢迎 使 用 IBM spss Statistics 
正在 准备 实 装 .… | 球 迎 人 spss Sta 


IBM SPSS Statistics 24 窑 装 程序 正在 准 音 Installshield | 
ee 你 寺 成 注 : 填 得 。; 吉 正己。 安装 程序 正在 准备 Installshield Wizard，InstallShield Wizard 
| Wizard， 它 将 引号 您 完成 剩余 的 安装 过 程 。 请 稍 候 将 引 皇 你 寺 成 程序 去 装 过 程 ， 请 稍 候 。 


正在 解压 缩 : IBM SPSS Statistics 24.masi ~ 正在 计算 空间 需求 


一 | 


[< 上 -5g [下 -*#0> ] Gms 
图 4-2 ”空间 计算 


欢迎 使 用 IBM Spss Statistics 24 Installshield 
Wizard 


or We 外 计 个 冰 > 们 对 WES : 星 舌 堆 要 为 BM spss statistics 24 启用 2AWS for Windows 屏幕 阅读 软件 


© 天井) 
各 是 (1) 


注意 : 有 关 在 1BM SPSS Statistics 24 中 使 用 JAWS 的 详细 信息 请 参阅 帮助 。 


Installshield 


4-3 ”欢迎 向 导 图 4-4 是 否 屏幕 阅读 
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| IBM spss statistics - Essentials for Python 
ss = | 


才 装 I6M SPSS Statistics - Essentials for Python 


许可 证 协议 
请 仔细 阅读 下 面 的 计 可 证 协 襄 * 


县 。 HISTORY OF THE SOFTIWARE 


画 是 人 
器 二 0) 


Python was created in the early 19930s by Guido 
Rossum at Stichting Mathematisch Centrum (CWI, see 
http://www. cwi.nl) in 七 he Netherlands as a 
SUCcCcessor of a language called ABC. Guido remains 
Python's principal author, although it includes 
many contributions from others. 


本 版 本 的 Essentials for Python 包括 : 
-Python V2,7 & 3.4 
- IBM SPSS Statistics 24 - Integration Plug-in for Python 
-Python Extension Commands for SPSS Statistics 


局 我 接受 该 证 可 证 协 说 中 的 条 吉 (A) 
向) 我 不 接受 该 许可 证 协议 中 的 条 款 人 b) 
| Installshield 


| Installshield 


图 4-5 是 否 加 载 Python 


软件 许可 协 襄 
请 仔细 网 太 下列 计 可 协议 。 


PT 一 一 将 IBM SPss statistics 24 安装 到 : 
许可 信息 D:\programme'\epss24\ 

下 面 到 出 的 这 些 程 序 按照 以 下 许可 信息 条 惑 和 条 件 以 及 获得 寡 户 与 IHE 事先 同 
意 的 程序 许可 条 款 授 予 许 可 。 如果 客户 事先 未 同意 对 本 程序 生效 的 许可 条 就 ， 

那 必 IBK 国际 程序 许可 协议 (7126-3301-14) 适用 。 


程序 名称 : IBN SFS55 Statistics - Essentials for Python 24.0 
程序 号 : Too1 


根据 国际 软件 许可 协 说 ‘“IPLA”) 和 本 许可 信息 中 的 描述 ，IBK 授予 被 评 可 
方 有 限 的 使 用 本 程序 的 权利 。 本 权限 恨 限 于 援 可 使 用 级 别 ， 如 被 计 可 方 根据 


加 我 接受 许可 协 说 中 的 全 部 条 款 。 (A) 
回复 不 接 爱 计 可 协 说 中 的 任何 条 款 * (D) | 
| Installshield 


[Installshield 
Cf-sw > abespe | [<L-® || 
4-7 是 否 接受 Python 协议 图 4-8 ”开始 复制 文件 


正在 安装 IBM spss Statistics 24 
正在 安装 您 选择 的 程序 功能 。 


| 已 做 好 修改 程序 的 准备 
向 导 准 备 开 始 安装 。 

Installshield Wizard 正在 安装 IBM SP55 Statistics 24 ， 请 稍 候 。 这 需要 

几 人 名 的 时 间 。 ; 

状态 : 

正在 发 布 产 品 信 息 

Eee 


单 击 安 装 开始 安装 。 
要 查看 或 更改 任何 究 装 设置 ， 请 单 击 - 上 一 步 “*。 单 击 取消 退出 向 地。 


Installshiald 


图 4-9 ” 安 疼 确定 4-10” 安 六 中 


| < 上 -9) | -SW > | 
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IBMSPSeS Statistics 


已 注册 进行 试用 ? 
要 于 i 榴 用 读 吉 1\ 全 关于 注册 的 电子 由 了 4 十 直 。 


内 本 昌 了 i 和 下 十 (E】 ; | 


Installshield Wizard 成 功 地 安装 了 1IBM SPSs Statistics 24 。 
单 击 完 成" 瘟 出 器 导 。 


己 购 买 上 网 SPSS Satistics ? 
司 动 " 讳 可 向 时 “所 普 问 外 NM SPSS Slatistics*+ 


已 鹤 圳 好 助 于 IBM SPSS Siatistics ? 


rr 


图 4-11 完成 安装 图 4-12 输入 邮箱 


单 击 “ 完 成 ”按钮 ，SPSS 24.0 将 启动 运行 ， 如 果 未 能 启动 ， 可 以 在 程序 栏 中 找到 
IBM SPSS Statistics 24.0 程序 ， 单 击 运 行 ， 首 次 运行 会 弹出 图 4-12， 在 电子 邮件 框 中 填 入 
正确 的 邮箱 ， 即 可 以 获取 试用 权限 进行 试用 。 

填 入 电子 邮件 后 ， 弹 出 SPSS 数据 视图 ， 如 图 4-13 所 示 ， 至 此 ，SPSS 24.0 试用 版 已 
经 安装 完毕 ， 可 以 开始 SPSS 数据 分 析 之 旅 啦 ! 如 果 你 安装 出 现 问 题 ， 请 百度 搜索 “网 
易 云 课堂 ”， 在 云 课堂 中 搜索 “ 松 哥 统 计 ”， 可 以 找到 松 哥 发 布 的 SPSS 快速 入 门 的 免 
费 视 频 教 程 进行 学 习 。 


尼 无 标杆 1 [三 据 靠 0] - IBM spss statistics 数据 纺 周 吕 


[By spss staietce BHF | | |uncodaon [| | | 
图 4-13 SPSS 界面 
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> 43 SPSS 启动 与 退出 


在 Windows 昌 面 ， 单 击 “ 开 始 ” 一 “所 有 程序 ”一 “IBM SPSS” 一 “IBM SPSS 
Statistics 24.0” 命 令 ， 即 开始 运行 SPSS 24.0。 当 软件 安装 结束 后 ， 你 也 可 以 在 桌面 创建 
SPSS 24.0 的 快捷 方式 。SPSS 有 多 种 退出 方式 : 单 击 SPSS 窗口 右上 角 的 “x” 图 标 ; 选 
择 并 单 击 菜单 中 的 “Exit” 命 令 ;， 双击 SPSS 窗口 左上 角 的 窗口 控制 菜单 图 标 。 这 些 都 比 
较 简单 ， 无 须 细 讲 。 


叶 4.4 SPSS 24.0 窗口 简介 


SPSS 主要 窗口 包括 : 数据 视图 (data view) 、 变 量 视图 (variable view) 、 结 果 输 
出 窗口 (output view) 、 图 表 编 辑 窗口 (chart editor) 、 语 法 编辑 器 窗口 (syntax editor) 
和 脚本 编辑 窗口 (script view) ; 其 中 最 常用 的 是 数据 视图 、 变 量 视图 ， 其 他 窗口 在 需要 
用 到 时 再 讲解 。 知 识 的 学 习 存 在 二 八 定律 , 我 们 初学 者 一 定 要 将 有 限 的 精力 放 在 最 常用 、 
取 里 要 的 知识 点 上 哦 ! 


4.4.1 数据 编辑 窗口 


当 我 们 启动 SPSS 后 ， 出 现 的 第 一 个 窗口 即 为 数据 编辑 窗口 ， 如 图 4-14 所 示 。 数 据 
编辑 窗口 是 用 户 进行 数据 处 理 与 分 析 的 主要 窗口 界面 ， 用 户 可 在 此 窗口 进行 数据 输入 、 
观察 、 编 辑 和 统计 分 析 等 操作 ， 是 SPSS 最 主要 的 操作 窗口 界面 。 


= 4-14 SPSS 24.0 0 数据 编辑 窗 口 
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1.“ 标 题 栏 ”: 箭头 1 所 指 区 域 ， 显 示 窗 口 名 称 和 编辑 的 数据 文件 名 。 如 果 当 前 数据 编 
辑 器 中 是 一 个 新 建 的 文件 , 其 显示 为 “未 标题 【数据 集 0】 一 IBM SPSS Statistics 数据 编辑 器 ”。 

2“ 莱 单 栏 ” : 箭头 2 所 指 区 域 ， 从 左 至 右 包 插 “Fileg”“Edit”“View”“Data” 
“Transform” “Analyze” “Direct Marketine” “Graphs” “Utilities” “Add-ons 
“Windw” 和 “Help” 菜 单 。 

3.“ 钊 用 工具 栏 ”: 篆 头 3 所 指 区 域 ， 列 出 了 数 扼 
据 窗口 最 常用 的 工具 见 图 4-15。 


编辑 所 使 用 的 向 用 工具 。SPSS 数 


去 本 和 7 
LT 本 一 一 
嘎 起 湖 且 的 区间 > 


图 4-15 工具 栏 常 用 工具 


4.“ 数 据 和 单元 格 信息 显示 栏 ”: 箭头 4 所 指 区 域 ， 其 中 灰色 区 域 显 示 单 元 格 的 位 置 ; 
空白 区 域 为 数据 编辑 区 ， 显 示 当 前 选中 的 单元 格 的 内 容 ， 用 户 可 在 该 区 域 输入 或 修改 相 
应 的 内 容 。 


5$“ 数 据 编辑 显示 区 ”: 箭头 5 所 在 的 中 部 网 格 区 ， 该 区 最 左边 列 显示 单元 序列 号 ， 
最 上 边 一 行 显示 变量 名 称 。 选 中 的 单元 格 呈 黄色 显示 ， 其 内 容 将 出 现在 数据 和 单元 格 信 
恩 显 示 栏 中 ， 在 此 和 输入 或 修改 单元 格 内 容 。 

6.“ 视 图 转换 栏 ”: 箭头 6 所 指 区 域 ， 用 于 进行 变量 和 数据 视图 的 切换 ， 用 户 只 需 
单 击 相应 的 标签 便 可 以 完成 变量 与 数据 视图 的 切换 。 

7.“ 系 统 状态 栏 ”: 箭头 7 所 指 区 域 ， 显 示 当 前 的 系统 操作 ， 用 户 可 通过 该 栏 了 解 
SPSS 当前 的 工作 状态 。 对 于 初学 者 ， 系 统 状 态 栏 务必 保留 ， 因 为 该 栏 可 以 帮助 用 户 了 解 
目 己 对 数据 进行 了 哪些 选择 性 的 操作 。 


4.4.2 ”变量 编辑 窗口 


在 数据 编辑 窗口 的 左下 角 ， 单 击 “ 变 量 视图 ”按钮 ， 即 可 弹出 “变量 编辑 ”窗口 ， 
如 图 4-16 所 示 。 在 该 窗口 可 以 命名 变量 的 名 称 、 类 型 、 宽 度 、 小 数位 、 变 量 标签 、 变 量 
值 标 签 、 缺 失 值 、 列 的 宽度 、 对 齐 方式 、 度 量 标准 及 对 角色 进行 设置 ， 此 处 不 殉 ， 后 面 
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| 值 | 缺失 | 列 | 对 齐 a 
| 无 又 居中 名 义 输入 国 
0 性别 无 | 无 |8 | 要 居中 乓 名 义 输入 | 


人 二 


身高 无 无 |8 达 居 中 | 达标 度 输入 
体重 无 无 8 到 居中 | 光标 度 YY 输入 
年 龄 ”无 无 8 县 居 中 |# 标 度 输入 
血型 无 | 无 |8 国 居 中 


ET ] nico 


图 4-16 ”变量 编辑 窗口 


4.4.3 结果 输出 窗口 
结果 输出 窗口 用 于 输出 统计 分 析 的 结果 或 绘制 的 相关 图 表 ， 如 图 4-17 所 示 。 


Ep up Es i 

i 本 本 i i i i i i i si 
a a 9 Eee 
“1400 1500 -1600 1700 1800 1900 


身高 


必 [EN SRSS otc ni ri | Unicoae a | 


4-17 SPSS 的 结果 输出 窗口 


结果 输出 窗口 左边 是 导航 窗口 (箭头 1 所 示 ) ， 显 示 输 出 结果 的 目录 ， 单 击 目录 前 
面 的 加 、 减 号 可 显示 或 隐藏 相关 内 容 ， 右 边 是 显示 窗口 (箭头 2 所 示 ) ， 显 示 所 选 内 容 
的 细节 。 


字 4.5 SPSS 数据 库 构建 


SPSS 数据 库 构建 有 两 种 方法 : 一 为 间接 法 ， 即 利用 SPSS 去 调用 其 他 形式 的 数据 库 ， 
实施 “ 拿 来 主义 ”， 如 dbf、txt、xls 等 ， 大 多 数 研究 者 是 将 研究 数据 放 入 Excel 中 存储 ， 


| 第 4 章 SPSS 简介 与 数据 库 构建 | 025 


因此 调用 Excel 数据 为 较 常用 的 间接 法 数据 库 构 建 ; 二 为 直接 法 ， 即 利用 SPSS 直接 构建 
数据 库 ， 本 法 相对 费事 。 虽然 间接 法 更 为 常用 , 但 直接 法 是 SPSS 初学 者 必须 掌握 的 方法 ， 
因为 在 利用 间接 法 建 库 时 ， 有 些 软 件 默 认 人 参数 未 必 人 符合 分 析 目 的 ， 需 要 进行 调整 ， 不 会 
直接 法 ， 将 不 知 如 何 调 整 。 就 像 你 给 你 梦 中 情人 写 情 书 ， 不 会 写 ， 抄 了 同学 的 情书 送 过 
去 了 ， 送 完 才 发 现 一 一 署名 也 抄 成 同学 的 了 。 

SPSS 数据 格式 为 经 典 的 行列 式 : 每 行 代表 一 个 记录 、 个 案 ， 每 列 代表 一 个 变量 。 格 
式 参 考 表 4-1。 很 多 人 习惯 用 Excel 存储 数据 ， 切 记 ， 当 用 SPSS 调用 时 ，Excel 数据 也 应 
该 录入 为 如 下 格式 ， 否 则 SPSS 无 法 准确 识别 。 


表 4-1 SPSS 数据 录入 格式 要 求 


| 
二 机 学 


人 
帘 
天 
| 


里 
i 
| 


对 
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一 | 一 


外 
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了 ECD EE 
CE EE lw 
CE EE TT ET 
人 APP 辽 | 020017 | | 好 

计算 机 学 院 | 0811212017 一 


4.5.1 间接 法 数据 库 构建 


图 4-18 所 示 为 一 小 型 数据 ， 存 储 于 Excel 文件 中 ， 现 在 利用 SPSS 直接 调用 ， 构 建 
SPSS 数据 库 ， 操 作 如 下 。 


i 
1 


于 


图 4-18 四 名 同学 的 一 般 资 料 数据 


操作 步骤 
1. 双击 SPSS 图 标 : 打开 SPSS; 如 果 SPSS 已 经 打开 ， 直 接 按照 第 二 步 操作 。 
2. 选择 菜单 : 文件 一 打开 一 数据 ， 弹 出 图 4-19， 将 文件 类 型 框 选 为 “所 有 文件 ”， 
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然后 单 击 “SPSS 数据 库 构 建 ”， 单 击 “ 打 开 ” 按 钮 。 

3. 弹出 询问 框 : 目 SPSS 24.0 开始 ， 读 取 Excel 数据 为 可 视 化 读 取 ， 用 户 可 以 可 视 
化 观察 数据 读 取 的 情况 ， 如 图 4-20 所 示 。 此 处 重点 关注 第 一 个 复 选 框 ， 询 问 是 否 将 第 一 
行当 作 变 量 名 录入 ; 竺 录入 资料 的 第 一 行 就 是 变量 名 ， 故 直接 点 击 “确定 ” 按 钮 。 用 户 
可 以 答 试 将 复 选 框 中 的 “V ”取消 ， 你 会 发 现 可 视 化 读 取 窗 口中 的 变量 名 由 Vi、V2 等 代 
蔡 。 男 外 ， 有 时 我 们 将 数据 放 在 Excel 的 其 他 工作 表 ， 此 时 将 “工作 表 ” 框 下 拉 沫 单打 开 ， 
选择 相应 的 工作 表 即 可 。 


| 风 名 略 陷 城 的 行 Fi 
回 从 字符 囊 惜 中 阵 去 前 导 鹤 格 删 ) 
加 作 皇 特惠 值 中 除去 属相 2 桔 人 ) 


File name: 


Excel [* xls, *.xlsx, "Xlsm) 


唱 绊 的 数据 府 型 基于 所 有 部 握 "并 屿 可 能 二 同 于 预 旋 内容， 后 者 基 
于 前 200 个 歼 据 行 ， 预 此 倪 显 示 前 500 个 列 


Tom em 
图 4-20 询问 窗口 
4. a 弹出 SPSS 数据 库 ， 如 图 4-21, 一 般 就 可 以 进行 后 续 数 据 整 理 与 分 析 ， 
但 有 时 会 需要 调整 。 点 击 :“ 文 件 一 保存 ”, 或 者 直接 点 击 保 存 按钮 , 将 此 数据 库 进行 保存 ， 
即 利 用 et SPSS 数据 库 。 


4-19 SPSS 打开 数据 


| |IBM SFSS Statistice 处 理 程序 就 当 | | |Unicoda:ON | 


4-21 Excel 读 取 后 SPSS 数据 
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4.5.2 ”下 接 法 数据 库 构 建 


直接 法 数据 库 构建 为 初学 者 必须 掌握 的 数据 库 构建 方法 ， 可 以 分 为 两 大 步 一 一 先 变 
量 后 数据 ， 即 先 定义 数据 库 中 的 变量 ， 然 后 录入 相应 的 数据 ， 有 点 先 买 票 ， 然 后 才能 进 
入 电影 院 就 座 看 电影 的 意思 ， 以 知识 结构 而 言 ， 第 一 步 更 为 重要 。 下 面 仍 以 图 4-18 的 次 
料 为 例 进行 说 明 。 

操作 步 又 

1. 双击 果 面 SPSS 图 标 ， 打 开 SPSS 。 

2. 点 击 菜单 :文件 一 新 建 一 数据 ， 打 开 一 个 新 的 SPSS 数据 窗口 ， 点 击 左下 角 “ 变 
量 视图 ”， 转 换 到 “变量 ”， 如 图 4-22 所 示 。 


了 "下 标明 5 [本 过 全 5 - 5RSS Statistics 数 托 滑 辐 生 Pr” pe mi . 加 le i 


图 4-22 ”变量 视图 


(1) 每 个 变量 需要 设置 11 项 属性 ， 其 中 “类 型 ”和 “测量 ”相对 较为 重要 ， 如 果 
设置 出 错 可 能 会 影响 后 续 分 析 ; 其 他 属性 设置 基本 仅 与 展示 方式 相关 ， 不 会 影响 分 析 ; 
变量 类 型 设置 与 测量 尺度 设置 窗口 见 图 4-23、 图 4-24。 


加 利 学 计数 法 (8) ee 
| 加 日 项 W 
| 加 关 元 咒 
定制 人 市 (Ul) 
| 加 字符 囊 {R) 
加 受 阳 数字 ! 带 有 前 导 零 的 整数 )(E) 


Qi) " 散 字 “类 型 使 用 数位 分 组 设置 ' 而 " 案 限 数字 “ 趟 使 用 数位 分 组 < 


图 4-23 ”变量 类 型 图 4-24 度量 标准 


(2) 变量 类 型 中 初学 者 只 需 关 注 第 一 个 “数字 ”和 倒数 第 二 个 “字符 串 ” 即 可 。 录 
入 变量 值 为 数值 时 选择 “数字 ”， 录 入 的 变量 值 为 汉字 、 英 语 等 字符 时 ， 选 择 “ 字 符 ”。 
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图 4-24 度量 标准 有 三 个 选项 ， 分 别 为 “ 标 度 ”“ 有 序 ” 和 “名 义 ”， 分 别 对 应 于 统计 学 
上 的 数值 变量 、 有 序 分 类 变量 与 无 序 分 类 变量 ， 大 家 要 根据 专业 进行 选择 。 

(3) 数值 型 变量 为 标准 型 , 系统 默认 宽度 为 8 位 , 小 数 点 默认 为 2 位 , 小 数 点 用 圆 点。 
字符 型 变量 (String) ， 其 值 由 字符 串 组 成 ， 系 统 默 认为 8， 超 过 8 为 长 字符 型 变量 ， 不 
超过 8 为 短 字符 变量 。 字 符 型 变量 不 能 参与 运算 ， 且 大 、 小 写 存 在 区 别 。 注 意 SPSS 24.0 
采用 unicode 模 式 , 每 个 汉字 占 位 4 个 字符 , 大 家 务必 设置 足够 的 宽度 , 否则 无 法 显示 完 

3. 本 例 录 入 第 一 个 变量 ， 在 第 一 行 变量 名 称 中 录入 “姓名 ”， 类 型 选择 “字符 串 ”， 
“测量 ” 选择“ 名义”， 其 他 默认 。 后 续 的 “性 别 ”“ 血 型 ”因为 都 是 字符 型 ， 与 “姓名 ” 
录入 方法 类 似 ; “身高 ”“ 体 重 ” 和 “年 龄 ”为 数值 型 变量 ， 输 入 相应 变量 名 称 后， 类 
型 选择 “数字 ”， 度 量 标准 选择 “ 标 度 ”， 其 他 可 以 默认 。 本 例 变 量 设置 完毕 后 如 图 4-25 
所 示 。 


列 无 标量 2 溉 县 集 1] - 昌 M spss Statistics 魏 振 币 扬 器 = 
| HD 灾 看 人 0 潮 抽 吕 】 。 转换 左 )。 务 本国。 直销 同 ) 。 图 隧 IE) ” 帝 用 得 序 亿 ) 。 扩 春 仿 ) 窗口 他 厂 葬 (H) 


与. | 国志 Ew) 
值 | 缺 类 | 列 | 对 齐 
无 无 | 中 


8 三 三 居中 
8 局 居 中 
8 
a 


车 居中 
于 居中 
慰 后 中 


图 4-25 录入 后 变量 属性 设置 


4. 变量 录入 完毕 后 ， 点 击 窗口 左下 角 “ 数 据 视图 ”按钮 ， 将 每 个 变量 的 数据 录入 相 
应 的 位 置 , 完毕 后 保存 数据 库 , 即 可 完成 直接 法 数据 库 的 构建 , 最 终 数据 库 如 图 4-26 所 示 。 


起 SP55 王 后 库 构建 .sav | 梁 湛 条 1] - 阳 M SPSS Statistics 要 所 大 轧 二 
交付 区 ) 。 摘 辑 个) 直 看 呈 。 当 措 但) 转 搜 四 分 析 信 | 直 梢 QM 图 形 (E) “实用 程 订 邮 扩展 全) 窗口 他 | 各 助 lH 
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[BM SPSS Siafisfcs 站 理 程序 起 结 | | UnicodeoN | | 


图 4-26 和 直接 法 录入 数据 库 
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SPSS 数据 库 构建 完毕 后 ， 根 据 分 析 的 需要 ， 有 时 需要 对 数据 库 进 行 整理 与 清洗 ， 包 
括 排序 、 选 择 个 案 、 加 权 个 案 、 缺 失 值 蔡 换 、 转 置 与 重新 编码 等 功能 ， 具 体 统计 分 析 方 
法 请 参照 本 书 相关 章节 的 案例 操作 部 分 。 

4.5.3 ”数据 编辑 

数据 录入 完毕 后 ， 可 以 对 数据 进行 相应 的 编辑 ， 如 修改 、 删 除 、 复 制 、 粘 贴 等 。 此 
处 请 大 家 把 SPSS 当 作 Excel， 操 作 与 Excel 完全 一 样 。 下 面向 大 家 介绍 三 右键 功能 。 

1. 列 变 量 右 键 

当 我 们 选择 “体重 ”变量 右键 ， 可 以 弹出 右键 菜单 ， 并 可 以 执行 相应 的 操作 ， 大 家 
自己 尝试 ， 重 点 为 可 以 直接 对 “体重 ”变量 进行 “描述 统计 ”( 见 图 4-27) 。 

2. 行 变量 右键 

当 我 们 选中 某 一 行 ， 点 击 右键 ， 也 可 以 进行 相应 的 操作 ， 具 体 如 图 4-28 所 示 。 


区 品 性 别 | 之 身高 | 
不 | 168 


图 4-27 列 变量 右键 功能 图 4-28 行 个 案 右 键 实现 功能 
3. 单元 格 右键 


当 我 们 选中 茶 一 个 具体 的 单元 格 ， 氮 击 右键 ， 弹 出 图 4-29， 亦 可 进行 相应 的 操作 。 


图 4-29 单元 格 右键 实现 功能 
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数据 库 构 建 经 验 小 结 : 


常用 是 间接 ， 必 学 是 直接 ; 
直接 分 两 步 ， 变 量 和 数据 ; 
变量 两 注意 ， 类 型 和 度量 ; 
类 型 看 两 种 ， 数 值 和 字符 ; 
度量 依 专业 ， 三 种 要 对 应 ; 
方便 数据 录 ， 数 值 优 字符 ; 
把 握 上 原则 ， 大 错 租 一边。 


SPSS 数据 库 构建 有 很 多 需要 注意 的 细节 ， 此 处 不 袭 ， 具体 可 见 松 哥 公 众 号 (data973) 
免费 的 视频 教程 。 


> 4.6 SPSS 分 析 过 程 三 级 窗口 


三 级 窗口 演示 采用 数据 库 data01.sav， 请 大 家 打开 相应 数据 库 进 行 操作 。 


4.6.1 一 级 窗口 (数据 窗口 ) 
一 级 窗口 就 是 SPSS 数据 视图 窗口 , 包含 着 所 有 的 统计 分 析 数 据 以 及 各 项 功能 的 菜单 。 
如 图 4-30 所 示 。 
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lieM SPSS statistics 处 理 程序 就 结 | | [unicode:DN| | | 


图 4-30 data01 数据 展示 
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4.6.2 ”二 级 窗口 ( 功能 窗口 ) 


为 了 实现 茶 项 分 析 功 能 ， 则 需要 调用 相应 的 功能 窗口 ， 如 想 知 道 男 女生 的 身高 有 没 
有 : 5 开 ， 进行 两 独立 样本 1 检验 ， 调用 独立 样本 i 检验 窗 LL]， 如 图 才 -31] 。 


图 4-31 二 级 功能 窗口 


二 级 是 实现 某 项 统计 功能 的 主要 窗口 界面 ， 其 上 包含 三 个 主要 部 分 : 一 为 数据 库 的 
变量 框 (A) ， 框 中 含有 构建 数据 库 中 的 各 种 变量 名 称 ; 二 为 目前 检验 变量 框 (B) ， 用 
户 将 本 次 想 进 行 分 析 的 变量 放 入 ; 三 为 参数 按钮 (C) ， 点 开 按 钮 可 以 对 实现 1 检验 这 个 
功能 的 某 些 参数 进行 修改 设置 。 二 级 窗口 是 进行 SPSS 数据 分 析 最 重要 的 窗口 哦 ! 

4.6.3 三 级 窗口 (参数 窗口 ) 

三 级 窗口 的 打开 ,是 借助 二 级 窗口 中 的 参数 按钮 ,如 点 击 图 4-31 中 的 “选项 ”参数 按钮 ， 
弹出 图 4-32, 可 以 对 置信 区 间 范 围 及 缺失 值 处 理 进 行 设置 。 三 级 窗口 设置 完毕 后 , 点 击 “ 继 


续 ”, 会 再 次 回 到 二 级 功能 窗口 , 反击“ 确定 ”, 此 时 软件 就 开始 运行 了 。 数据 库 不 大 的 话 ， 
一 般 1 一 2 秒 ， 运 算 完毕 ， 然 后 结果 输出 窗口 目 动弹 出 ， 展 示 结 果 。 


置信 区 辣 百分比 (C): 国 |%| 
缺失 什 - 
加 按 有 具体 分 析 排 除 个 案 (A) 


| @ 成 列 者 除 个 麻山 


音 SPSS 24.0 数据 管理 


在 我 们 已 经 将 科研 数据 构建 入 SPSS 数据 库 ， 正 式 开 始 数 据 分 析 之 前 ， 为 了 让 数据 
能 够 符合 我 们 研究 目的 的 分 析 规 范 ， 还 应 该 进行 数据 整理 ， 这 一 过 程 称 为 数据 管理 。 数 
据 管理 就 是 我 们 从 菜场 买 荣 回来 后 ,对 菜 进 行 清洗 的 过 程 ， 沫 不 征 一 买 回 来 就 能 下 钢 的 。 
SPSS 具备 完备 的 数据 管理 功能 ， 本 章 将 讲解 最 常用 的 10 项 数据 管理 功能 。 数 据 管 理 功 
能 在 SPSS 的 数据 染 单 和 转换 菜单 ,为 了 讲解 的 系统 性 , 先 介 绍 一 下 文件 ,编辑 和 查看 六 单 ， 
然后 再 介绍 数据 管理 功能 。 


> 5.1 文件 、 编 辑 、 查 看 荣 单 介绍 


为 了 保证 SPSS 软件 讲解 的 完整 性 ， 在 讲解 数据 管理 功能 之 前 ， 把 SPSS 11 个 菜单 
中 的 前 三 个 菜单 〈 文 件 、 编 辑 、 查 看 ) 给 大 家 简单 介绍 一 下 ， 见 图 5-1。 数 据 管理 菜单 ( 数 
据 、 转 换 ) 在 5.2 小 节 中 讲解 。 


回国 标记 入 四 #() 
办 未 出 坟 量 视图 (5) 
二 变量 


| | 
图 5 文件 (A) 、 编 辑 (B) 、 查 看 菜单 (C) 
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软件 设计 是 按照 完美 方案 进行 设计 ， 可 是 使 用 者 学 习 是 按照 实用 思路 学 习 的 ， 软 件 
的 80% 功能 用 处 都 是 不 大 的 ， 另 外 的 20% 的 模块 却 承担 着 该 软件 的 80% 的 应 用 ， 这 就 
是 所 谓 的 二 八 定律 。 因 此 根据 松 哥 18 年 的 使 用 SPSS 的 经 验 ， 挑 出 一 些 最 常用 实用 的 进 
行 讲解 ， 见 图 5-1 框 中 标注 部 分 。 


5.1.1 文件 (第 用 5 个 ) 


文件 菜单 里 面 模块 很 多 , 但 最 常用 的 就 是 “新 建 ”“ 打 开 ”“ 保 存 ”“ 男 存 为 ”和 “ 导 
出 ”选项 。 

1. 新 建 与 打开 

“新 建 ” 选 项 为 创建 新 的 SPSS 相关 文件 ， 如 图 5-2 所 示 。 可 以 新 建 4 种 窗口 文件 ( 数 
据 窗口 、 语 法 窗口 、 结 果 输 出 窗口 和 脚本 ) ， 其 中 最 常用 的 是 “数据 窗口 ”。 语 法 对 于 相 
对 高 级 用 户 才 用 到 ; “结果 输出 窗口 ”是 自动 弹出 的 , 可 以 不 管 ; “脚本 ”更 是 高 级 用 户 才 用 ， 
平时 基本 不 用 。 而 “打开 ”菜单 与 “新 建 ” 相 对 应 , 新 建 的 文件 存储 后 ,下 次 都 可 以 直接 打开 。 


曾 -无 标题 1 [数据 入 0] - 1BM SPSS Statiatcs 数 括 吴语 二 
文件 三 ) ”编辑 堪 ) ”查看 (VY) ”数据 也) ”转换 [[) ”分 析 (A) 


导入 数据 侣 ) 
盖头 阁 习 


图 5-2 文件 一 新 建 末 单 


2. 保存 与 男 存 为 

当 我 们 构建 了 数据 库 或 对 数据 库 进 行 了 相应 的 修改 后 ， 点 击 “ 保 存 ” 选 项 会 以 原文 
件 名 和 原 路 径 进 行 保存 “另存 为 ”选项 则 可 以 更 改 文 件 名 或 者 存储 路 径 。 

3. 导出 

“导出 ”菜单 可 以 将 我 们 新 建 的 数据 库 导 出 为 其 他 10 种 数据 库 格 式 ， 具 体 见 图 5-3。 


导出 [I) 1 | 忆 数据 库 (D). 

区 酝 立 件 标 斌 寺内 读 (K) EB 
渤 原 尘 甩 探 存 的 世 件 全) Cay 数据 .… 

蔷 重 命名 数据 集 (MM).. 制 表 符 分 隔 的 代 ).… 
显示 数据 文件 信息 仙 固定 安 本 (E).. 

冯 存 元 据 册 ) - SA3.. 

收集 变量 信息 

各 停止 妇 理 程序 Ctrl+ 各 点 i 

号 切换 服务 器 (W).. Re 

属 存储 库 ( 民 ) 1 DS TM1... 

总 打印 预览 QY) SYLK 


心 | 打印 人 P). Ctrl+P 


5-3 “导出 菜单 
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5.1.2 编辑 ( 常用 5 个 ) 


1. 插入 变量 与 个 案 

当 我 们 构建 好 数据 库 之 后 ， 发 现 需要 在 某 处 插入 相应 的 变量 与 个 案 ， 可 以 通过 此 菜 
单 操 作 ， 见 图 5-1 (B) 部 分 。 如 用 光标 激活 某 个 变量 ， 然 后 点 “插入 变量 ”选项 ， 即 可 
在 当前 激活 变量 之 前 插入 一 个 变量 名 为 “VAR0001” 的 变量 ， 双 击 可 以 进入 变量 视图 进 
行 变 量 名 修改 ; 同 理 激活 某 条 记录 (case) ， 上 点击“ 搬入 人 个案” 选项 ， 则 在 当前 记录 之 
前 插入 一 条 空 的 新 记录 ， 可 以 进一步 录入 数据 。 

2. 转 到 个 案 与 变量 

如 果 我 们 的 数据 库 非常 大 ， 有 超 多 的 变量 及 上 万 条 记录 ， 想 手动 直接 找到 某 个 变 
量 或 者 某 条 记录 ， 还 是 比较 费时 间 的 。 这 时 我 们 可 以 利用 转 到 个 案 与 变量 功能 。 打 开 
data01.sav 数据 库 ， 现 在 想 定位 到 第 500 条 记录 ， 然 后 定位 到 血型 变量 。 

转 至 个 案 菜单 操作 : 编辑 一 转 到 个 案 , 弹出 图 5-4。 框 中 输入 “500” 数 据 , 然后 点 击 “ 跳 
转 ” 即 可 。 

转 至 变量 菜单 操作 : 编辑 一 转 到 变量 ， 弹 出 图 5-5。 下 拉 框 找到 “血型 ”， 点 击 “ 跳 
转 ”， 可 以 直接 定位 到 “血型 ”变量 。 


申 “datajdolsav Sr IBM SPSS Statistics 数据 六 者 轿 。 ”Eola Tr -IBMSPSS St tics 台 并 多 入 和 


序 划 毕 | a -人 Spas Statlsics UnicooeON 一 区 本 | 
5-4 ” 转 至 个 案 图 5-5 转 至 变量 
3. 选项 
“选项 ”窗口 是 对 SPSS 内 部 属性 进行 设置 的 窗口 ， 初 学 者 不 用 浪费 过 多 的 精力 ， 
只 要 和 营 握 如 下 两 点 ， 驶 够 用 了 ， 一 是 语言 《 见 图 5-6) ， 二 是 透视 表 ( 见 图 5-7) 。 
1) 语言 : 用 于 软件 的 11 国语 言 互 换 ， 中 文 分 为 简体 和 繁体 两 种 ， 更 改 语言 应 该 对 
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得 出 和 用 户 界面 同时 修改 ， 或 者 根据 用 户 目 己 需 要 修改 。 


语言 环境 (C): 


男 Unicode {条 用 宇 符 集 } (W) Wes 


图 5-6 语言 设置 


2) 透视 表 : 用 于 设置 统计 分 析 输 出 的 统计 表 的 格式 ， 默 认 安 装 为 经 典 缺 省 ， 但 分 析 
出 来 的 结果 与 专业 上 的 三 线 表 相差 较 大 ， 此 处 请 改 为 Academic， 此 时 分 析出 来 的 统计 表 
与 三 线 表 非 常 接近 。 后 面 统计 图 表 章 节 ， 松 哥 会 讲授 如 何 制作 专业 的 统计 表 ， 或 者 直接 
关注 微 信 公众 号 data973， 回 复 “asongge” 即 可 直接 拿 到 松 哥 编写 好 的 模板 ， 直 接 复 制 
到 安装 目录 Looks 文件 夹 内 即 可 。 


EEEE) | 各 遇 遇 | ” 剖 轨 当 遂 E| 
] ] cocot | 
APA_TimesRoma_12pt | coeo 28 CT CC 


Blue dd2 ooool he le 
| BlueYellowContrast ecen2| 11.42 11.42 abed 
BlueYellowContrastAltern ate ”eeeo | 


| Classic 


5-7 ”透视 表 设置 


5.1.3 查看 


“查看 ”菜单 平时 很 少 用 到 , 即使 不 会 使 用 也 不 会 影响 到 数据 分 析 的 结果 。 其 中 的 “ 字 
体 ”可 以 帮助 我 们 更 改 字体 设置 ， 状 态 栏 用 于 显示 是 否 显示 系统 状态 ， 取 消 后 ，SPSS 数 
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据 视图 将 变 得 更 加 简洁 ， 但 建议 初学 者 保留 。 因 为 有 时 对 SPSS 进行 了 相关 操作 ， 初 学 
者 容易 忘记 ， 状 态 栏 会 给 予 提示 。 具 体 见 图 5-1 (C) 部 分 。 另 外 软件 不 用 担心 被 用 坏 ， 
感 兴趣 的 读者 可 以 每 个 功能 都 试 试 ! 


地 52 10 了 项 营 用 数据 管理 功能 


数据 终于 收集 好 了 ， 不 代表 立刻 就 能 分 析 了， 就 像 从 菜场 把 菜 买 回来 了 ， 也 不 是 直 
接 就 能 炒 沫 了 ， 还 要 把 沫 洗 洗 、 切 切 ， 才 能 炒菜 。 道 理 是 一 样 的 ， 科 研 数据 构建 好 SPSS 
数据 库 之 后 ， 根 据 研究 目的 ， 也 需要 对 数据 进行 清洗 、 整 理 ， 然 后 才能 够 进入 后 续 分 析 ， 
这 就 是 数据 管理 的 过 程 。 下 面 将 介绍 第 用 的 一 些 数据 管理 功能 ， 和 希望 大 家 和 擎 握 哦 ! 


5.2.1 ”排序 个 案 (sort cases ) (次 ) 


排序 个 案 ， 顾 名 思 义 ， 就 是 根据 变量 取 值 对 个 案 进行 排序 的 过 程 。SPSS 实现 排序 功 
能 有 两 种 操作 方式 : 菜单 操作 与 右键 操作 。 

1. 菜单 排序 操作 

案例 实战 : 采用 data01.sav 数据 库 ， 对 体重 进行 升序 排列 。 

操作 步骤 点 击 数 据 一 个 案 排序 (图 5-8〉; 弹出 图 5-9 个 案 排序 功能 窗口 。 软 件 默 
认 的 是 升序 “(A) 排列 ”， 扣 击 “ 确 定 ” 软 件 会 按照 升序 对 体 午 进行 排序 ， 夺 选择 “ 降 
序 (D) ” 即 可 降序 排列 。 


查看 (yj 有 i A 


站 国 人 | [3 定义 变量 属性 包 ) 


| 划 设 吐 测 旺 织 别 丰 知 的 字段 的 测量 她 别 L].- 


| 
| 排列 顺 床 
| | 画 升 厚 全 
| 加 降序 四 ) 中 
玉 良 名 | 图 a EE 
| 陈 亚 f a i : Fm 
| BE 标识 重 党 证 宰 {U). 
\ 文 | 
[os 一 | 交 标 设 恒 常 个 案 遇 :. 三 六 寺 引 lc 
比较 数据 扩 (P). 
一 5-8 。 个案 排序 菜单 位 轩 图 5-9 个 案 排 序 


2. 右键 操作 
操作 步骤 : 先 左 键 点 击 “ 体 重 ” 变 量 列 ， 然 后 右 击 ， 弹 出 图 5-10， 虚 线 中 标 出 的 即 
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为 升序 和 降序 排列 选项 。 


由 :datajd0l.sav [数据 入 1] - IBM SPSS Statistics 数据 仿 枉 蝇 [一 | 辑 : 
文件 {E) 切 辑 臣 ) 查看 (VW) 数据 上 P) 转 的 呈 分 析 [A) 直销 出 ) 图 形 (G@) 实用 程序 凯 ] 扩展 区 ) 窗口 QW) 帮助 (H) 
四 上 尖 琴 的 关 阅 蚜 


图 5-10 ”右键 排序 操作 方式 


3. 经 验 传授 

1) 升序 排列 A) 可 以 帮助 我 们 发 现 某 个 变量 有 无 缺失 值 及 有 无 较 小 的 异常 值 ， 降 
序 (D) 排列 可 以 帮助 我 们 发 现 特大 的 异常 值 。 

2) 进行 双 排序 ， 比 如 对 身高 和 体重 同时 进行 排序 ， 若 用 右键 操作 ， 只 能 同时 升序 或 
降序 ; 若 用 菜单 操作 ， 可 以 分 别 对 身高 和 体重 排序 方式 进行 定制 ， 同 时 要 注意 ， 菜 单 操 
作 中 先进 入 的 变量 优先 排序 。 如 先 放 入 年 龄 ， 后 放 入 身高 ， 则 先 对 年 龄 排序 ， 在 相同 年 
龄 的 情况 下 ， 再 按照 身高 进行 排序 。 


5.2.2” 转 置 文件 ( transpose ) 

SPSS 数据 格式 为 经 典 的 行列 式 ， 即 每 行 代表 一 条 记录 ， 每 列 代表 一 个 变量 。SPSS 
统计 分 析 只 能 够 对 变量 进行 分 析 。 然而 有 时 候 , 根据 研究 目的 , 我 们 需要 对 记录 进行 分 析 ， 
那 就 必须 将 记录 转化 为 变量 才 可 以 ， 这 个 功能 就 叫 作 转 置 ， 其 是 将 行 记录 变 为 列 变 量 的 
过 程 ， 模 式 见 图 5-11。 


图 5-11 转 置 模式 图 


038 | SPSS 实战 与 统计 思维 | 


案例 实战 有 10 位 专家 对 有 个 单位 进行 4 项 指标 打分 ,数据 为 data02.sav， 见 图 5-12， 
点 击 工具 栏 “ 变 量 ” 工 具 ， 得 图 5-13， 列 出 数据 集中 的 各 种 变量 ， 但 如 果 我 们 想 对 10 位 
专家 打分 之 间 有 无 差异 进行 分 析 ， 因 图 5-13 中 并 没有 10 位 专家 分 别 的 变量 信息 ， 故 必 
须 对 数据 进行 转 置 。 


和 dataidDZSAV WEE] - IBM SPSS Statisties 竹 寺 师 吉 各 


5 
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5 
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加 总 用 于 读 家 姓名 ] 
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图 5-12 10 位 专家 打分 数据 图 5-13 变量 视图 : 


操作 步 又: 点 击 菜单 数据 一 转 置 ， 见 图 5-14。 TR ( 见 图 5-15) ， 
将 4 个 变量 指标 放 入 变量 框 中 (该 框 中 变量 将 变 为 记录 ) , 将 变量 “用 于 专家 姓名 ” 放 入 “名 
称 变 量 ” 框 中 《该 框 中 的 变量 的 记录 将 变 为 变量 ) 


国 datajd02.5AV [数据 集 2] - IBM SPSS Statistics 数据 篇 辑 露 
文件 {E) ”编辑 瑟 ) ”查看 (V) ”数据 吕 ) ”转换 [0) 分析 多 。 直 铺 (MW) 。 图 形 公 ) 
己 ， 丽 | | 吕 定 久 到 县 局 任 WV) 
| 蓝 设置 测量 级 别 未 知 的 字段 的 测量 级 别 (L) 
凶 复制 数据 属性 伦 ) - 
上 新 建 定 制导 性 (上 昌 } 
名 定义 日 期 和 时 间 (E) - 
国定 义 杀 重 响应 集 全) 
验证 届 ) ' 
饼 标识 重 复 个 案 (U). 
网 标识 异常 个 案 仙 
| 如 比较 数据 集 (P) 


| 国足 交 件 调整 字符 审 宽度 


图 5-14 和 转 置 功能 窗口 调用 步骤 5-15 ” 转 置 功能 设置 


反击“ 确定” 后， 提示 未 转 置 的 变量 将 丢失 ,继续 “ 确 定 ”， 软 件 将 目 动 生 成 一 个 
新 的 数据 集 文件 ， 见 图 5-16， 大 家 发 现 10 位 专家 姓名 已 经 变 为 变量 。 我 们 调用 “变量 ” 
工具 ， 弹 出 图 5-17， 大 家 即 可 发 现 新 的 变量 列表 与 未 转 置 前 的 差别 ， 现 在 就 可 以 对 每 位 
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专家 评分 ， 以 及 专家 之 间 的 评分 进行 分 析 啦 ! 


5.00| 3.00 | 5.00 | 5.00 | 5.00 400 00 | 5.00 | 4.00 
S00| 0 | 50 500 |500| 500 | 40 | 5 的 | 5.00 
zb4 40| 0 5.0| 5.0 | 5 00 50 | .0 | 5.00 | 4.0% 


图 5-16 转 置 后 新 的 数据 集 图 5-17 和 转 置 后 数据 集 变 量 列表 


经 验 传授 : 如 果 你 有 数据 需要 转 置 , 但 不 知 将 哪些 变量 放 入 哪个 框 中 , 松 哥 告诉 你 ， 
你 把 旧 数 据 集中 的 所 有 变量 放 入 转 置 图 5-15 右上 角 的 框 中 ， 然 后 直接 点 击 确定 ， 在 新 生 
成 的 数据 集中 ， 你 会 发 现 哪些 是 多 余 的 变量 ， 然 后 删除 即 可 。 转 置 过 程 中 未 放 入 栏 中 的 
量 会 在 文件 中 遗失 ; 字符 串 变 量 不 能 转 置 。 熟 练 之 后 你 就 会 知道 如 何 选择 啦 ! 


$.2.3 合并 文件 (merge files ) 


合并 文件 就 是 将 两 个 文件 数据 合并 到 一 个 文件 中 去 的 过 程 。 根 据 研究 目的 ， 合 并 文 
件 有 两 种 方式 : 横 回 合并 与 纵 同 合并 ( 见 图 5-18) 。 


| 5 st ee ne | 


十 > 


图 5-18 合并 文件 的 两 种 方式 


1. 纵向 合并 

纵向 合并 是 指 增加 了 研究 个 案 ， 数 据 集 将 变 得 更 长 。 如 某 小 组 19 人 考试 考 了 数学 、 
物理 和 化 学 3 门 课程 ， 陈 老师 改 了 10 名 同学 试卷 并 将 成 绩 录入 数据 库 data03.sav， 武 老 
师 改 了 9 份 试 卷 ， 并 将 成 绩 录 入 为 data04.sav 数据 集 ， 现 在 要 把 两 位 老师 的 数据 集合 并 
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起 来 ， 数 据 集 的 变量 是 一 样 的 ， 此 时 其 实 就 是 人 数 的 合并 ， 合 并 后 数据 集 将 变 长 。 

操作 步骤 

1) 打开 数据 集 data03.sav 和 data04.sav 数据 ， 图 5-19 和 图 5-20。 发 现 两 个 数据 集 变 
量 一 样 ， 而 学 号 不 一 样 。 


1| 
2 
引 
4 
5 


5 
7| 


Pe 
I | 


5-19 ”data03 数据 库 图 5-20 data04 数据 库 


2) 沫 单 : 数据 一 合并 文件 一 添加 个 案 ， 弹 出 图 5-21。 从 “打开 数据 集 ” 框 中 选中 
data04.sav, 点 击 “ 继续” 如 果 data04.sav 没 有 打开 , 可 以 选择 下 面 外 部 SPSS 文件 进行 调用 。 


起 测 中 要 至 datajd03.sav 敬 据 生 4 


dR SR 
PR 


IQ 外 部 SPSS Statistics 数据 文件 


Cr ms mn mn my en my my wn my wn en ey ee es ee es es en ee en en ee mn ee ey ee es J 浏览 @)。 | | 
Es 3PSS 9tatistics 数据 文件 必须 先 在 SP33 Statistics 中 打开 ， 然后 才能 用 于 合并 * 


图 5.21 合并 文件 图 5.22 合并 文件 变量 选择 


3) 点 击 继续 弹出 图 5-22， 右 侧 框 中 显示 为 合并 后 数据 集中 的 变量 。 如 果 两 个 数据 
集 有 不 同 的 变量 ， 则 在 左 侧 框 中 显示 未 成 对 的 变量 。 点 击 “ 确 定 ” 运 行 ， 查 看 数据 集 视 
图 窗口 如 图 5-23 所 示 。 为 了 节省 篇 幅 ， 采 用 分 屏 显 示 ， 发 现 总 的 个 案 数 为 19 例 ， 合 并 
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三 *datajd03,sav [ 攻 搞 后 相 - IBM SPSS ctatistice a 局 坊 拓 I 
文件 ( 总 各 (查看 ( 数据 ( 转 执 ( 分 析 ( 直销 ( 图 形 ( 实用 程 F 扩展 ( 容 口 ( 帮助 (| 


5-23 ”合并 后 数据 


2. 横 回 合并 

用 于 增加 数据 集 的 变量 个 数 ， 横 回合 并 可 以 增加 数据 集 的 宽度 。 比 如 一 个 班级 期 末 
考试 ， 共 考 了 6 门 课程 ， 陈 老师 改 了 数学 、 物 理 和 化 学 ， 松 哥 改 了 地 理 、 历 史 和 政治 ， 
并 分 别 录 入 数据 库 data05.sav 和 data06.sav 数据 集 。 

操作 步骤 

1) 分 别 打 开 data05.sav 和 data06.sav 数据 集 ， 如 图 5-24 和 图 5-25 所 示 。 可 见 两 个 
数据 集 个 案 相 同 ， 但 变量 不 一 样 ， 现 在 合并 人 数 不 会 增加 ， 但 增加 的 是 变量 数 。 


蚁 datajd05.sav 阿 二 全 1] - TBM 3P53 statistics 数据 蝙 辑 疆 l 
京 件 臣 瘦 输 三 家 看 (VY 收据 旧 转 热 分 析 [& 直销 侧 图 彩民 实用 程序 由 扩展 区 窗口 (WL 必 助 (H| 


I | 
一 一 一 \ 


内 datajd06.sav [ 数 是 抹 2] - 1BM SPSS Statistics 煞 据 病句 器 | 


| 立 任 在 ; 续 辑 任 : 查看 位 数据 全 转换 红 分析 位 直销 做 同形 {@ 实用 程序 (L 扩 尼 人 X 窗口 同名 助 忆 


I 总 二 着 直 洒 可 村 本 


厅 和 : 4 本 
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所 


并 一 
| 


图 5-24 data05 数据 库 : 图 5-25 ”data06 数据 库 


042 | SPSS 实战 与 统计 思维 | 


2) 菜单 操作 : 数据 一 合并 文件 一 添加 变量 ， 弹 出 图 5-26。 选 择 data06.sav， 然 后 点 击 
“继续 ”， 弹 出 图 5-27。 同 样 地 ， 如 果 data06.sav 没有 打开 ， 可 以 调用 SPSS 外 部 数据 。 


| 重合 名 网 -| 
囊 按键 变量 匹 配 个 案 世 ) 
国 两 十 涩 括 集 中 的 个 闵 孝 接 暂 和 县 的 | 项 序 进 行 排序 从 ) 


是 未 活动 糙 癌 集 是 贺 控 未 区) 
策 : 活 动 数 据 集 星 狂 按 索 贡 ) 
几 而- 坟 上 印 提供 人 来 加 ) 


r= : 
IO 外 部 SPSS 3tatisties 数据 空 忻 | 指示 十 案 源 变 有 是 山 ;56UTEED1 


Ei J | es ET 2 信 ]= 活 动 数 据 麻 
非 SPSS Statistics 数据 文件 必须 先 在 SPSS Statistics 中 打开 ， 然 后 才能 用 于 合并 。 | | Me 搞 2 


图 5-26 合并 文件 数据 库 选择 图 5-27 合并 文件 变量 选择 


3) 横 回 合并 属性 设置 。 大 家 试想 一 下 ， 如 果 有 一 个 人 右手 五 个 手指 头 被 人 全 部 砍 断 
《有 点 残 有 如， 还 是 被 机 器 压 断 吧 ) ， 你 是 一 个 医生 ， 现 在 要 把 5 个 手指 头 接 上 ， 断 指 是 
不 是 应 该 接 到 对 应 的 手指 上 。 道 理 是 一 样 的 ， 两 个 数据 集 如 果 要 横 回 合并 ， 必 须 是 同一 
个 同学 的 成 绩 才 能 合并 , 因此 就 必须 要 有 一 个 变量 , 用 于 指示 是 不 是 同一 个 人 , 在 本 例 中 ， 
就 是 学 号 。 因 此 学 号 应 该 作为 连接 两 个 数据 库 的 识别 变量 。 

因此 ， 请 将 图 5-27 操作 为 图 5-28 后 ， 扣 击 “ 确 定 ”。 

4) 回 到 数据 视图 ， 如 图 5-29 所 示 ， 发 现 10 名 同学 的 6 门 课 成 绩 已 经 得 到 正确 合 
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图 5-28 ”关键 变量 设置 


| 第 5 章 SPSS 24.0 数据 管理 | 043 


5.2.4 ” 拆 分 文件 ( split files ) 


所 谓 “ 合 久 必 分 ， 分 久 必 合 ”， 前 面 我 们 学 了 2 种 合并 文件 的 方法 ， 这 里 讲解 如 何 
拆 分 文件 。 注 意 SPSS 合并 文件 是 指 把 两 个 文件 合 为 1 个 文件 ; SPSS 拆 分 文件 通常 不 是 
指 把 一 个 文件 拆 分 为 2 个 文件 ， 而 是 把 1 个 文件 按照 某 个 变量 分 成 几 个 部 分 。SPSS 中 还 
有 一 个 “ 拆 分 为 文件 ”， 是 将 1 个 文件 真正 地 拆 分 为 2 个 文件 ， 使 用 较 少 ， 此 处 不 装 。 

案例 实战 

案例 数据 data01.sav， 我 们 想 知 道 不 同性 别 学 生 的 映 高 情况 ， 该 如 何 分 析 呢 ? 

操作 步骤 

1. 打开 数据 集 data01.sav， 先 分 析 一 下 全 部 学 生 的 身高 。 

操作 如 下 : 分 析 一 描述 统计 一 描述 ( 见 图 5-30) 将 “身高 ” 放 入 变量 框 ， 点 击 “ 确 定 ” 
即 可 《 见 图 5-31) 。 


分 析 欠 直销 时 ) 图 形 (G) 
报告 (P) 


描 壕 统计 {E) 
表 旧 ) 

比较 平均 值 凤 ) 
一 般 线 性 模型 [G) 
三 攻 线 性 模型 从 ) 
站 合 棋 型 (X) 
相 天 (CC) 

ER) 

对 数 线 性 (O) 


” YY 


= 


图 S-30 ”统计 描述 功能 图 5-31 描述 设置 
得 到 结果 如 图 5-32 所 示 。 结 果 为 全 部 学 生 590 人 的 身高 结果 描述 。 
描 檬 统计 
个 案 数 。” ”最 小 值 。 最 大 值 ”平均 值 ”标准 差 
身高 590 145.0 184.0 164.379 7r.9816 
有 效 个 素数 【成 列 】 590 


图 5-32 data01 数据 喘 局 接 述 结果 


2. 按照 性 别 拆 分 文件 。 

操作 步骤 : 数据 一 拆 分 文件 ， 弹 出 拆 分 文件 功能 窗口 〈 见 图 5-33) 。 选 择 “ 比 较 组 ”， 
并 将 “性 别 ” 放 入 “分 组 依据 ”， 扣 击 “ 确 定 ”。 

3. 回 到 数据 视图 ， 并 未 发 生 明显 变化 ， 但 最 右 下 角 系 统 状态 栏 显示 “ 拆 分 依据 : 
性 别 ”， 见 图 5-34。 
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- IBM SPSS Statistics 数 大 篇 轧 器 | 本 


加 分 析 所 有 小 案 ， 不 他 嫂 组 
He “em ee wm ws we wi we ep we ws es 


癌 视 :12112 沾 志 量 
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20 


加 按 分 组 变量 进行 文件 排序 但) 
自 文件 已 排序 上 ) 


当前 状 仿 : 按 组 分 析 关闭 * 


到 到 到 到 河村 机 | 司 员 


”图 5.33 拆 分 文件 设置 一 图 5.34 “ 拆 分 后 状态 栏 显示 


4. 再 次 分 析 一 下 data01.sav 数据 集 ， 对 其 身高 进行 统计 学 描述 ， 步 又 同上 ， 得 到 结果 
如 图 5-35 所 示 。 如 果 图 5-33 处 选择 为 “ 按 组 组 织 输出 ”， 则 得 到 结果 如 图 5-36 所 示 。 两 
个 结果 是 一 样 的 ， 只 不 过 展示 方式 不 一 样 , 松 哥 更 加 喜欢 “比较 组 ”的 结果 ,， 因 其 更 加 简洁 。 


描述 统计 
个 案 数 最小 值 。 ”最 大 值 。 ”平均 值 ”标准 鞋 
身 向 303 152.0 184.0 170.092 5.5967 
有 效 个 案 数 (成 列 ) 303 : 
身 铅 287 145.0 173.0 158.347 5.1984 
有 效 个 案 数 (成 列 ) 287 


图 5-35 拆 分 条 件 ， 比较 组 


描述 统计 
个 案 数 。 ”最 小 值 最 大 慎 平均 什 标准 蔷 
身高 4303 152.0 184.0 170.092 5.5967 
有 效 个 案 归 (成 列 ) 303 
a. 性 别 = 男 


性 别 = 女 


描述 统计 ” 
最 小 值 凶 大 慎 平均 值 
身高 145.0 173.0 158.347 
有效 个 案 数 (成 列 ) 
a. 性 别 = 女 


图 5-36 ” 拆 分 条 件 : 按 组 组 织 输出 
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经 验 传 授 

初学 者 在 拆 分 之 后 进行 其 他 分 析 时 ， 会 发 现 所 有 分 析 都 是 拆 分 的 ， 无 法 直接 进行 分 
析 。 因 此 拆 分 完 , 分 析 后 ,记得 要 还 原 。 还 原 方法 即 所谓 “ 解 铃 还 须 系 铃 人 ”， 在 “ 拆 分 ” 
功能 窗口 选择 第 一 个 “分 析 所 有 个 案 ， 不 创建 组 ” 即 可 。 男 外 初学 者 要 实时 关注 SPSS 
数据 窗口 的 右 下 角 的 系统 状态 栏 ， 它 可 以 帮助 你 了 解 目 前 数据 的 状态 ， 这 也 是 前 面 松 哥 
让 大 家 把 系统 状态 栏 留 着 的 原因 。 


5.2.5 选择 个 案 (select cases ) (六 ) 


选择 个 案 是 在 数据 集中 选择 一 些 符合 某 些 条 件 的 案例 进行 后 续 分 析 。 要 想 掌握 “ 先 
择 个 案 ” 功 能 ， 只 要 完成 松 哥 的 3 个 案例 就 可 以 充分 掌握 啦 ， 


案例 一 : 如 果 满 足 某 个 条 件 方 可 入 选 
在 数据 集 data01.sav 中 ， 选 择 年 龄 大 于 19 岁 的 大 学 生 ， 描 述 其 身高 。 
操作 步骤 
1. 学 习 此 功能 之 前 ， 大 家 先 描述 一 下 所 有 大 学 生 的 身高 ， 步 骤 为 : 分 析 一 描述 统计 一 
描述 ， 将 “身高 ”移入 变量 框 中 ， 点 击 “ 确 定 ”， 得 到 结果 ( 见 图 5-37 (A) ) ， 可 见 
590 名 大 学 生 ， 身 高 均 数 为 164.379cm， 标 准 差 为 7.9816cm。 


个 素数 级 小 值 最 大 值 平 雪 值 标准 著 
身高 590 145.0 184.0 164.379 7.9816 
有 效 个 素数 (成 列 ) 590 


个 案 数 最 小 值 最 大 值 平均 值 标准 其 
身高 278 145.0 184.0 164.505 8.4494 
有 效 个 案 数 (成 列 ) 218 


图 5-37 ”身高 摘 述 结果 
2. 现在 我 们 来 选择 年 龄 >19 岁 的 学 生 分 析 身 高 ， 操 作 如 下 : 数据 菜单 一 选择 个 案 ， 弹 
出 选择 则 个 案 框 〈 见 图 $-38) 。 如 图 中 红 框 选择 点 击 “ 如 果 ” 按 钮 ， 弹 出 图 5-39 所 示 窗 口 。 
3. 如 图 5-39 所 示 下 条 件 框 中 , 输入 “年 龄 >19”, 点 击 “ 确 定 ”, 回 到 图 5-38, 再 次 “ 确 
定 ”， 运 行 。 
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数据 借 名 标 司 1 : 
总 响 降 未 站 定 的 十 索 LL) 


图 5-39 下 设置 


4. 回 到 数据 视图 ， 如 图 5-40 所 示 ， 数 据 库 外 观 发 生 两 处 变化 ， 一 为 凡是 年 龄 不 大 于 
19 岁 的 ， 数 据 库 默认 的 ID 编号 均 被 斜 线 划 去 ， 表 示 该 个 案 删 除 不 参加 后 续 分 析 ; 二 ; 
在 数据 库 的 最 右边 产生 一 个 0、1 编码 的 flter 控 制 变量 , 凡是 1 的 均 是 符合 年 龄 大 于 19 岁 ， 
0 表示 不 大 于 19 岁 ， 其 实 SPSS 是 通过 产生 一 个 过 滤 变 量 ， 以 控制 后 续 哪 些 个 案 参加 分 
析 的 。 大 家 不 信 删 除 这 个 过 滤 变 量 ， 你 会 发 现 全 部 都 参加 分 析 了 。 


EE 
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5-40 条件 选择 后 数据 


5. 此 时 我 们 再 次 分 析 , 描述 一 下 身高 , 步骤 同 1, 得 到 结果 如 图 5-37 所 示 (B) 的 部 分 ， 
可 以 发 现 分 析 的 大 学 生 个 案 数 278 人 ， 身 高 均值 164.505cm， 标 准 差 为 8.4494cm。 如 果 
测试 删除 右 侧 的 filter 变量 ， 再 次 分 析 ， 则 又 会 得 到 图 5-37(A) 的 结果 。 
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案例 二 : 随机 个 案 样本 的 近似 法 

此 功能 其 实 是 进行 随机 化 抽样 ， 依 旧 选 择 数 据 集 data01.sav， 随 机 化 抽取 其 中 的 30% 
的 样本 ， 进 行 其 身高 的 描述 。 

操作 步骤 

1. 数据 一 选择 个 案 ， 弹 出 图 5-41， 选 择 “ 随 机 个 案 样 本 ”， 然 后 点 击 “ 样 本 按钮 ” 
弹出 图 5-42。 

2. 图 5-42 中 ,选择 “大 约 ” 框 ， 并 在 框 中 填 入 “30”， 意 思 即 随机 抽取 30% 的 样本 。 
点 击 “ 继 续 ”， 回 到 5-41， 再 次 确定 。 


料 幸 人 | ED | in 

FREE 
ELT : 
日 使 用 过 演变 量 (U) : 


| 


输出 

凤 过 滤 掉 未 迁 定 的 个 康 ( 昌 ) 

名 将 选 定 个 案 复 也 避 所 数据 集 介 ) 
煞 据 后 名 称 避 1: 


图 5-41 随机 个 案 样 本 


3. 返回 数据 视图 如 图 5-43 所 示 ， 大 家 发 现 系 
统 默 认 ID 有 和 斜 线 划 去 的 个 案 ， 数 据 库 最 右边 产生 
filter 变量 。 你 们 得 到 的 图 和 松 哥 不 一 样 ， 因 为 数据 
库 变量 较 多 ， 为 让 大 家 看 全 ， 松 哥 设 置 了 分 屏 哦 ! 

4. 此 时 大 家 再 次 描述 分 析 一 下 身高 数据 ， 得 到 结 
果 如 图 5-44 所 示 。 抽 样 188 人 ， 均 值 164.670cm。 如 
果 你 跟着 做 ， 虽 然 用 的 是 同样 数据 集 ， 你 做 的 结果 
和 松 哥 肯定 不 一 样 ， 你 肯定 会 想 ， 那 科研 的 严谨 性 、 : | 
可 重复 性 呢 ， 这 个 软件 以 后 我 还 敢 用 吗 ? 图 5-43 ”选择 后 样本 


(w]e) RE) 攻 焉 浊 a 


bd) 
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描述 统计 
个 率 数 撤 小 值 撤 太 值 平均 值 标准 兰 


“身高 188 147.0 1830 164.670 8.1603 
有 效 个 案 数 (成 到 ) 188 


图 5-44 选择 后 样本 分 析 结 果 


这 个 大 家 不 用 担心 ， 之 所 以 出 现 这 样 的 结果 ， 是 因为 我 们 采用 的 是 近似 抽样 。 也 就 
是 大 约 抽样 ， 即 有 的 人 抽 了 187 人 、188 人 、189 人 ， 甚 至 也 有 190 人 了 昵 。 如 果 咱 们 可 以 
设置 同样 的 随机 数字 种 子 ， 那 么 得 到 的 结果 就 会 一 模 一 样 了 。 下 面 跨 们 就 用 精确 法 ， 抽 
一 个 一 样 的 结果 的 。 

案例 三 : 随机 个 案 样本 精确 抽样 

和 案例 二 的 近似 抽样 ， 寻 致 重 现 性 较 差 ， 甚 至 你 自己 做 两 遍 的 结果 都 不 一 样 ， 让 心情 
很 是 不 静 。 咱 们 现在 要 在 数据 集 data01.sav 中 精确 抽样 60 人 ， 进 行 后 续 身 高 的 描述 分 析 。 

操作 步骤 

2. 弹出 图 5-41， 依 旧 选 择 “ 随 机 个 案 样 本 ”， 然 后 点 击 按钮 “样本 ”。 弹 出 如 图 5-45 
所 示 窗 口 。 

3. 图 5-45 中 ， 选 择 “ 正 好 为 ”， 并 在 框 中 输入 “60”， 因 为 总 共有 590 个 样本 ， 所 
以 后 面 输入 来 自前 “590”。 注 意 如 果 你 打算 在 前 100 个 里 面 抽 ， 则 输入 100， 该 框 可 
以 个 性 化 选择 方案 ,统计 上 的 系统 抽样 (机 械 抽样 ) 此 处 可 以 实现 。 点 击 “ 继 续 ”， 回 到 
图 5-41 所 示 窗 口 。 

4. 点 击 “ 确 定 ”， 回 到 数据 集 的 数据 视图 ， 图 5-46。 发 现 系统 默认 ID 很 多 划 去 斜 线 
以 及 产生 的 flter 过 滤 变 量 。 


F 料 寺 去路 
- 太 的 的 30  % 的 所 有 个 来 


图 5-45 ”精确 抽样 图 5-46 ”精确 抽样 结果 
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5. 我 们 现在 再 分 析 一 下 选取 的 60 人 的 号 高 数据 , 方法 同 前 , 得 到 结果 如 图 5-47 所 示 。 
发 现 抽 样 人 数 59 人 , 什么 ?怎么 就 59 人 ,刚才 不 是 精确 抽样 抽 60 人 吗 ? 这 是 啥 软件 呀 ， 
算 了 松 哥 ， 我 不 学 了 。 

呵呵 ， 此 时 在 做 的 你 可 能 是 60， 也 有 可 能 是 58、59 等 。 你 肯定 在 想 ， 前 面 案例 二 
咱们 得 到 的 不 一 样 ， 说 松 哥 说 的 是 近似 抽样 ， 现 在 是 精确 抽样 了 ， 怎 么 还 不 一 样 ， 不 会 
是 这 个 软件 真 的 不 靠 谱 吧 ? 

其 实 是 这 样 的 ， 咱 们 每 个 人 都 抽 到 了 60 人 ， 只 不 过 呢 ， 松 哥 运 气 不 好 ， 我 抽 到 的 那 
60 人 里 面 ， 有 1 个 人 的 身高 值 是 缺失 值 ， 所 以 计算 时 只 有 59 了， 你 明白 了 吗 ， 哈 哈 ! 
如 果 你 不 相信 ， 你 对 filter 变量 进行 降序 排列 ， 你 会 发 现 确 实 有 60 个 人 ， 但 是 在 60 个 人 
中 ， 确 实 有 人 身高 值 是 缺失 的 。 


148.0 180.0 165.576 8.1599 


图 5-47 精确 抽样 分 析 结 琳 


选择 个 案 功 能 是 数据 管理 非常 常用 的 一 项 功能 ， 掌 握 松 哥 所 述 的 三 个 案例 ， 基 本 够 
大 家 用 了 。 


(1) 选择 了 其 中 一 部 分 分 析 后 ， 若 再 想 分 析 全 部 数据 ， 可 以 直接 删除 filter 过 滤 变 
量 即 可 ， 这 比重 新 菜单 操作 ， 选 择 全 部 案例 要 方便 ; 
(2) 如 果 选 择 不 是 从 第 一 个 个 案 开始 , 可 以 选择 图 5-41 中 的 “基于 时 间或 个 案 范围 ”。 


5.2.6 ”加 权 个 案 (weight cases ) (六 ) 


加 权 个 案 是 一 个 数据 集 简 化 的 方式 ， 是 把 同类 个 案 放 在 一 行 记录 进行 呈现 ， 如 松 哥 
到 超市 买 了 3 瓶 矿 果 水， 每 瓶 2 元 ，3 个 面包 ， 每 个 5 元 ， 采 用 加 权 与 不 加 权 可 以 有 两 
种 数据 集 构 建 方式 ， 如 图 5-48 和 图 5-49 所 示 ， 你 会 发 现 后 者 比 前 者 要 简单 得 多 。 如 果 
松 哥 买 了 300 瓶 矿 果 水 和 300 个 面包 ， 你 会 发 现 ， 数 据 集 图 5-49 的 效率 就 不 得 了 了 ， 依 
旧 是 2 行 就 可 以 ， 而 数据 集 图 5-48 则 要 600 行 。 

讲 到 这 里 松 哥 相信 你 已 经 知道 ， 图 5-49 中 的 变量 “数量 ”， 其 实 代表 的 就 是 前 面 商 
品 的 权重 。 可 是 我 们 在 分 析 时 ， 软 件 是 不 知道 “数量 ”就 是 权重 变量 的 ， 因 此 我 们 就 必 
须 告诉 软件 ， 这 个 过 程 就 是 “加 权 个 案 ”。 
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昌 datajd08.sav 熙 据 集 5] - IJBM SPSS Statistics 数据 编辑 器 | 
交 件 下 编辑 住 查看 Gy 数据 {C 转换 条 分 析 亿 直销 也 图 形 {€ 实用 程序 | 扩展 忆 窗口 他 帮助 人 


下 合力 =: ~ 人 E 汪 折 


| 可 视 : #4 壬 个 变量 
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[a | | | | 

5 | | | | | _ 9 
2 一 


图 $-48 ”逐条 录入 式 图 5-49 ”同类 合并 式 录入 


为 了 验证 我 们 的 想法 ， 我 们 分 别 对 data07.sav 和 data08.sav 数据 集 进 行商 品 的 平均 价 
格 分 析 ， 感 受 分 析 操 作 上 的 不 同 。 

1. 分 析 data07.sav: 分 析 一 描述 统计 一 描述 ， 在 弹出 对 话 杠 中， 将 “单价 ” 放 入 右边 
框 中 ， 点 击 “确定 ”， 得 到 结果 ， 如 图 5-50 (A) 所 示 。 

2. 分 析 data08.sav: 分 析 一 描述 统计 一 描述 ， 在 弹出 对 话 框 中 ， 放 入 “单价 ”， 点 击 
“确定 ”， 得 到 图 5-50(B)〉。 发 现 个 案 数 只 有 2 个， 显然 是 不 对 的 。 

3. 加 权 分 析 : 数据 一 个 案 加 权 ， 弹 出 图 5-51， 个案 加 权 对 话 框 ， 将 “数量 ” 放 
入 “个 案 加 权 系 数 ” 框 中 ， 点 击 “ 确 定 ”。 回 到 数据 视图 ， 你 会 发 现 系 统 状态 栏 显示 “ 权 
重 开 局 ”， 表 示 你 已 经 加 权 成 功 。 


A 描述 统计 


单价 ' 2 5 350 1.643 |@ 个 案 加 权 条 数 (WN) : 
频率 变量 (F) : 


BB 描述 统计 


刁 小 值 最 太 值 平均 值 标准 其 
Ww | SMe THR 


有 效 个 案 数 ( 成 列 ) | (LW 证 ] [#50k(E) 重要 (R) | 取消 |。 名 助 


图 5-50 ”描述 结果 图 5-51 个 案 加 权 


4. 分 析 data08.sav: 分 析 一 描述 统计 一 描述 ， 在 弹出 对 话 框 中 ， 放 入 “单价 ”， 点 击 
“确定 ”， 会 再 次 得 到 图 5-50 (A) 。 

经 验 传授 : 加 权 一 般 在 频数 表 和 分 类 变量 资料 的 行列 表 时 应 用 ， 共 同 特征 为 有 一 个 
频数 项 ， 分 析 时 需要 对 频数 项 进行 加 权 。 


| 第 5 章 SPSS 24.0 数据 管理 | 051 


5.2.7 ”计算 变量 ( compute ) 


计算 变量 就 是 利用 现 有 数据 集中 的 变量 ， 按 照 一 定 的 数学 公式 与 逻辑 表达 式 ， 产 生 
一 个 新 的 变量 的 过 程 。 

案例 实战 

依旧 以 data01.sav 为 例 ， 数 据 集中 有 身高 (cm) 和 体重 (kg) 变量 ， 而 我 们 知道 体 
质 指数 BMI= 体重 (kg) /身高 (m)“。 现 在 我 们 利用 “计算 ”功能 产生 BMI 新 的 变量 。 

操作 步骤 

1. 打开 datajd01.sav 数据 集 ， 将 身高 和 体重 变量 拖 放 到 一 起 ， 方 便 查看 ， 不 拖 放 一 起 
也 没关系 。 

2. 菜单 : 转换 一 计算 变量 ， 弹 出 图 5-52。 左 侧目 标 变量 框 中 输入 “BMI”， 右 侧 
“表达 式 框 中 ”输入 “体重 / (身高 /100)“”。 注 意 身 高 单位 为 cm， 因此 身高 应 该 除 以 
100。 

， 回 到 数据 视图 5-53， 你 会 发 现 数据 集 最 右边 产生 了 新 的 BMI 变量 。 


3. 点击 “ 确 


"dataid01.sav [数据 朱 3] -JBM SPSS Statistics 数 拓 编 辐 器 。 【Ed | 关 沁 二 
一 一 一 


本 和 12712 个 训 居 


图 5-52 计算 变量 对 话 框 一 和 一 计算 变量 结果 


5.2.8 ”重新 编码 ( recode ) 


重新 编码 一 般 用 于 将 连续 性 变量 转化 为 分 类 变量 。 结 合计 算 变 量 产 生 的 BMI， 我 们 
演示 一 个 新 的 练习 。 
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案例 实战 

己 知 BMI 的 不 同 取 值 ， 代 表 的 专业 意义 如 图 5-54 所 示 。 我 们 上 面 计 算得 到 的 BMI 
都 是 具体 数字 ， 能 否 直接 显示 专业 上 的 “消瘦 ”“ 正 常 ” 等 呢 ? 这 个 就 可 以 通过 重新 编 
人 码 实 现 。 


2 


图 5-54 BMI 专业 意义 代码 


操作 步 又 
1. 调用 重新 编码 菜单 : 转换 一 重新 编码 为 不 同 的 变量 ， 操 作 如 图 5-55 所 示 ， 弹 出 图 
556, 


2. 图 5-56 中 ,将 BMI 放 入 右边 框 中 ， 然 后 给 重新 编码 为 不 同 的 新 的 变量 起 个 名 字 ， 
本 例 取 BMI 1， 然 后 点 击 “ 变 化 量 ”， 就 会 出 现 BMI_BMI 1， 扣 击 “ 旧 值 与 新 值 ”按钮 ， 
弹出 图 5-57 所 示 窗 口 。 


转换 个 ) “分析 他) ”直销 ( 制 ) ”图 形 {G) 实 ， 


图 计算 变量 ({C) . 
可 编程 性 转换 
| 国 对 个 案 中 的 值 进 行 计数 (D) 
变动 值 (FE) 

国 重新 护 玛 对 相同 的 变量 (S) ， 

天 重新 编码 为 不 同 变量 (R).. 

自动 重新 编码 (A).. | _ ee se 
图 5-55 重新 编码 为 不 同 的 变量 沫 单位 置 图 5-56 本 新 全 码头 不 同 的 坊 量 


3. 图 5-57 中 ， 分 别 按照 图 5-54 的 规则 设置 ， 完 毕 后 点 击 “继续 ”， 回 到 图 5-56， 
点 击 “确定 ” 
4. 回 到 数据 视图 ， 发 现 最 右边 产生 一 个 新 的 变量 BMI 1， 其 值 分 别 为 我 们 专业 所 需 
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图 5-57 昌 值 与 新 值 设置 图 5 赋值 后 结果 


(1) 大 家 发 现 图 5-355， 重 新 编码 分 为 重新 编码 为 相同 的 变量 与 重新 编码 为 不 同 的 变 
量 2 种 ,建议 大 家 只 学 不 同 ， 别 学 相同 ， 因 为 相同 编码 会 把 原始 数据 履 盖 ， 而 且 不 可 恢复 ， 
如 果 没 有 备份 ， 可 能 会 造成 很 大 的 影响 。 因 此 ， 只 学 编码 不 同 的 变量 ， 此 时 不 会 覆盖 原 
始 变量 。 

(2) 在 学 习 时 ， 可 能 会 出 现 图 $-57 右上 角 的 “ 值 ” 框 中 无 法 输入 汉字 的 情况 ， 那 
是 因为 没 把 右 下 角 “ 输 出 变量 是 字符 串 ” 勾 选 上 。 

(3) SPSS 重新 赋值 窗口 ， 图 5-57 中 ， 范 围 如 果 输 入 18 和 20， 是 指 10 科 工 过 20; 
在 最 低 到 某 值 ， 如 果 输 入 18， 是 指环 和 18; 如 果 输 入 某 值 到 最 高 ， 如 输入 19， 则 是 指 
了 三 19。 意 思 是 ，SPSS 中 的 范围 设置 都 是 包含 等 于 的 。 因 此 设置 时 要 密切 注意 ， 防 止 出 
现 同一 个 值 有 2 个 去 处 的 可 能 。 有 具体 可 以 通过 增加 小 数 点 进行 分 制 ， 如 年 龄 <18 岁 设 置 
为 1，> 18 为 设置 为 2， 此 时 2 为 包含 等 于 没 问题 ， 那 么 1 可 以 设置 为 X<17.999， 就 可 
以 区 分 开 了 ! 


$.2.9 ” 目 动 重新 编 伍 


自动 重新 编码 主要 用 于 将 字符 型 变量 进行 数值 化 ， 并 且 给 予 “ 值 标签 ”编码 。 这 是 
非常 实用 的 一 个 功能 。 

案例 实战 

案例 数据 集 data01.sav， 其 中 有 个 变量 为 “专业 ”， 上 下 拖 动 数据 集 ， 你 会 发 现 专业 
挺 多 ， 到 底 有 几 个 呢 ? 
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操作 步 又 

1. 打开 data01.sav， 点 击 全 单 : 转换 一 目 动 重 新 编码 ， 弹 出 图 5-59。 将 变量 “专业 ” 
放 入 “变量 一 新 名 称 ” 框 ， 新 名 称 框 中 输入 “专业 1”， 并 点 击 “ 添 加 新 名 称 ” 按 钮 ， 
点 击 “确定 ”。 


对 所 有 变量 使 用 同一 种 重新 编码 方案 (U) 
| 日 将 入 字符 串 什 视 为 用 户 屿 失 值 @) 
模板 天 一 一 
加 应 用 文件 中 的 模板 四 : 弃 IE 


图 5-59 目 动 重新 编码 


2. 回 到 数据 视图 ， 见 图 5-60， 在 变量 的 最 右边 ， 产 生 一 个 新 的 变量 “专业 1”， 你 
会 发 现 专业 1 都 是 数字 展示 的 。 数 字 代 表 什 么 意思 呢 ? 大 家 到 变量 视图 ， 找 到 “专业 
1” 的 值 标 签 ， 知 道 每 个 数字 代表 的 意思 〈( 见 图 5-61) ， 并 且 知 道 总 共有 11 个 专业 。 


图 5-60” 目 动 赋值 后 结果 图 5-61 自动 赋值 后 的 值 标签 
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$.2.10 ”缺失 值 奉 换 (replace missing value ) 


缺失 值 蔡 换 , 顾名思义 是 对 获取 的 数据 集中 的 缺失 值 , 采用 统计 的 方法 填补 , 有 人 说 ， 
这 不 是 造假 吗 ? 呵呵 ， 还 真 不 是 的 ， 这 是 一 种 统计 处 理 技术 ， 这 种 方法 甚至 可 以 写 到 你 
的 文章 中 去 。 

案例 实战 

案例 数据 集 data01.sav， 里 面 有 很 多 缺失 值 ， 还 记得 咱们 抽样 的 时 候 ， 明 明 抽 60 人 ， 
却 只 有 59 个 数 吗 ? 咀 们 现在 对 “ 吴 高 ”数据 进行 缺失 值 填补 。 

操作 步骤 

1. 打开 data01.sav 数据 集 。 

2. 菜单 : 转换 一 替换 缺失 值 ， 弹 出 图 $S-62， 将 “身高 ” 放 入 新 变量 框 中 ， 名 称 为 “ 身 
高 1”。 注 意 缺 失 值 苦 换 不 会 覆盖 原始 的 变量 ， 会 产生 新 的 变量 。 方 法 杠 中 提供 的 是 5 
种 缺失 值 蔡 换 的 方法 ，〈1) 序列 均值 : 是 指 用 所 有 其 他 数据 的 均值 ， 作 为 缺失 数据 的 数 
值 ，(2) 临近 点 的 均值 : 如 果 你 的 数据 具有 序列 特征 ， 并 且 数 据 可 能 符合 正 态 分 布 ， 则 
用 临近 点 的 均值 比 较 合 适 ， 此 时 可 以 选择 临近 2 个， 还 是 3 个 临近 点 ; (3) 临近 点 的 中 
间 值 “中 位 数 ) : 同样 用 于 有 序列 特征 的 数据 ， 同 时 数据 可 能 不 符合 正 态 分 布 ; 〈4) 线 
性 插值 ， 利 用 线性 模型 ， 去 预测 缺失 值 ，(5) 临近 点 线性 趋势 : 也 是 利用 线性 模型 ， 但 
当 第 一 个 值 或 者 最 后 一 个 值 缺 失 ， 用 线性 插值 没 法 计算 ， 线 性 趋势 则 可 以 。 

3. 大 学 生 的 身高 应 该 符合 正 态 分 布 , 因此 我 们 采用 默认 “序列 均值 ”进行 演示 , 点 击 “ 确 
定 ”。 回 到 数据 视图 ， 发现 最 右边 的 “身高 1”。 想 知道 是 如 何 蔡 代 的 ， 请 大 家 对 “身高 ” 
进行 升序 排列 ， 可 以 得 到 图 $S-63。 你 会 发 现 所 有 缺失 的 身高 ， 都 已 普 换 为 164.4cm。 
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图 5-62 缺失 值 苦 换 图 5-63 ”缺失 值 昔 换 结 果 
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在 上 述 的 数据 管理 功能 中 ， 一 些 稼 用 功能 的 已 经 放 入 到 SPSS 常用 工具 栏 中 ， 
5-64， 沼 用 工具 栏 操 作 要 比 亲 早操 作 快捷 方便 得 多 哦 ! 


H HP H H + 了 b Hi py Hi HP 时 时 上 + H + H -EE——— 


rr 是 | 下 mr 

二 局 国 四 中 一 

‘nl mE 二 二 二 己 二 = E 对 -| 1 二 二 二 三 三 二 | 
1 a EFF mn isl 一 一 - 一 …- - er 于 于 下 
i 证 上 x i er es 


|IBM SPSS Statlstics 处 理 程序 就 络 | | |unicodeoN| [| | | 
图 5-64 SPSS 常用 数据 管理 的 快捷 工具 图 标 


初级 统计 说 一 说 ， 怎 么 说 ， 两 个 字 : 图 表 。 


松 哥 统计 


统计 分 三 级 ， 初 级 说 一 说 ， 中 级 比 一 比 ， 高 级 找 关 系 ; 通达 初级 者 ， 可 为 人 中 上 品 ; 
通达 中 级 者 ， 可 谓 人 中 精品 ; 然 通 达 高 级 者 ， 为 人 中 极品 也 | 


初级 说 一 说 ， 一 月 可 握 轮 廊 ; 中 级 比 一 比 ， 一 年 可 悟 其 骸 ; 高 级 找 关系 ， 十 年 方 可 
罕 一 斑 。 故 关系 研究 乃 统计 中 的 上 乘 功夫 ， 需 沉淀 而 不 能 急 踩 ， 需 渐 悟 而 不 可 速成 ， 需 
持 恒 而 不 可 瞬 ! 


统计 如 功夫 ， 需 拜 其 师 ， 从 其 道 ， 常 问 之 ， 勤 践 之 ， 融 汇 之 ， 领 悟 之 , 方 可 大 成 ; 然 
每 师 必 有 其 长 , 亦 自 有 其 短 , 遇 一 师 不 足以 登 顶 , 故 应 多 方 访 学 , 取长补短 , 其 乃 成 功 之 道 ! 


自古 统计 无 师 自 通 者 鲜 有 之 ,， 偶 有 ， 也 必 将 走火 入 魔 ， 误 入 穷 门 之 左 道 | 


然 统 计 毕 竟 乃 一 工具 ， 专 业 更 是 航海 之 舵 ， 多 数 专业 之 人 士 ,， 不 可 短 其 业 ， 却 以 统 
计 补 之 。 故 统计 为 倒 ， 专 业 为 手 ， 手 握 剑 可 披 讲 ， 剑 划 手 必 叭 血 也 |! 
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世界 是 物质 的 ， 物 质 是 运动 的 ， 运 动 是 会 产生 数据 的 ， 数 据 是 有 规律 的 ， 而 我 们 对 
这 种 规律 的 认识 必须 通过 茶 种 工具 才能 发 现 ， 这 种 工具 就 是 “统计 学 ”。 言 下 之 意 ， 统 
i 去 发 现 规律 的 ， 而 数据 是 统计 学 上 变量 的 数值 体现 。 


计 学 是 通过 数据 

变量 分 为 三 种 ， 计 量 、 等 级 和 计数 ， 根 据 能 力 大 小 ， 分 别称 为 老大 、 老 二 和 老 三 ， 
第 1 章 曾 经 介绍 过 。 遗 憾 的 是 老 二 没有 特定 的 描述 指标 ， 因 此 将 老 二 下 降 一 级 变 为 老 三 ， 
所 以 统计 上 主流 就 有 老大 和 老 三 的 统计 摘 述 指标 。 老 二 不 是 没有 ,只 不 过 不 常用 , 如 众 数 、 
中 位 数 和 秩 均 值 还 是 可 以 用 的 。 


=> 06.1 计量 变量 


我 们 人 类 对 一 个 陌生 事物 的 认 知 ， 首 先 从 其 外 形 开始 ， 然 后 再 探讨 其 属性 性 质 。 正 
如 大 家 在 购买 这 本 书 时 ， 看 到 作者 是 松 哥 统 计 ， 并 想 进一步 了 解 他 ， 则 你 首先 会 想 ， 这 
家 伙 长 啥 样子 呢 ? 然后 会 进一步 想 了 解 ， 松 哥 多 大 、 高 不 高 、 胖 不 胖 等 属性 特征 ! 同样 ， 
当 我 们 初学 计量 变量 ， 我 们 也 首先 想 知 道 计 量变 量 长 啥 样子 呢 ? 

松 哥 告诉 你 ， 对 于 绝 大 多 数 计量 变量 数据 ， 其 长 相 就 是 图 6-1 的 单 峰 分 布 的 样子 ， 
为 什么 呢 ? 不 为 什么 ， 这 是 在 人 类 没有 干预 的 情况 下 ， 该 种 资料 目 然 的 分 布 形 态 ， 我 们 
就 称 为 规律 。 


图 6-1 计量 变量 的 常见 形态 


上 面 三 种 分 布 类 型 分 别 为 正 偏 态 分 布 A) 、 对 称 分 布 (B) 和 负 偏 态 分 布 〈C) ， 
其 中 的 对 称 分 布 当 对 称 性 和 峰 度 较 好 时 就 是 我 们 和 常 说 的 “ 正 态 分 布 ” 了 。 三 种 分 布 以 对 
称 分 布 为 例 ， 是 不 是 像 一 个 沙 堆 ， 并 且 发 现 沙 堆 越 往 中 间 沙 子 越 多 ， 中 间 的 沙子 最 多 ， 
这 种 越 靠 近 中 间 频 数 越 多 的 趋势 就 是 统计 学 的 集中 趋势 《centraltendency) ; 如 果 我 们 
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现在 抓 一 捧 沙 ， 从 沙 扒 中 间 慢 慢 流 消 而 下 ， 此 时 会 发 生 什么 现象 呢 ? 是 不 是 沙 堆 除 了 轻 
微 增高 一 点 点 《因为 集中 趋势 ) 外 ， 绝 大 部 分 的 沙 都 顺 着 沙 堆 四 周 逃 逸 而 去 。 可 我 们 并 
没有 让 它 跑 呀 ， 而 沙子 自然 而 然 地 四 散 而 去 ， 这 也 是 一 种 趋势 ， 叫 离散 趋势 (dispersion 
tendency) 。 

一 句 哲 语 “ 任 何事 物 都 具备 两 面 性 ”， 就 像 太 极 的 “阴阳 ”， 人 间 的 “男女 ”， 我 
们 计量 数据 分 为 “集中 和 离散 ”2 个 属性 。 因 此 在 了 解 其 外 形 之 后 ， 我 们 从 集中 和 离散 
两 个 角度 来 研究 其 属性 。 


6.1.1 集中 趋势 


1. 算数 均 数 ， 简 称 均 数 《mean) 

描述 一 组 数据 在 数量 上 的 平均 水 平 ， 总体 均 数 (nu) 和 样本 均 数 (x) 用 不 同 符号 表示 。 
适用 范围 为 对 称 分 布 ， 特 别 是 正 态 分 布 资料 。 其 计算 就 是 一 个 样本 所 有 变量 值 相 加 除 以 
样本 量 ， 式 (6-1) 。 松 哥 开 访 说 要 写 一 本 没有 统计 公式 的 SPSS 论 善 ， 下 面 的 公式 仅 为 
让 你 理解 ， 不 需要 记忆 。 

人 (6-1) 
n 

2. 中 位 数 (median，M) 

中 位 数 是 将 一 组 数据 按照 从 小 到 大 的 顺序 排列 ， 位 置 居 中 的 那个 数 。 如 6、8、5、9、 
3 的 中 位 数 就 是 6。 因为 中 位 数 只 要 能 够 按照 大 小 排序 就 可 以 计算 ， 故 适用 范围 更 广 ， 只 
要 能 够 大 小 排序 的 数据 均 可 以 计算 中 位 数 ， 中 位 数 为 计算 集中 趋势 的 “万 金 油 ”。 但 中 
位 数 因为 没有 利用 原始 数据 的 信息 ， 因 此 代表 性 没有 均 数 好 。 和 均 数 相 比较 为 迟钝 ， 只 
有 样本 量 较 为 充足 时 结果 才 稳 定 。 

因此 ， 一 组 数据 符合 对 称 分 布 尽量 用 均 数 ， 偏 态 分 布 时 才 考 虑 用 中 位 数 。 

3. 几何 均 数 (geometric mean，G) 

当 我 们 的 计量 数据 是 等 比 资料 ， 我 们 还 可 以 用 几何 均 数 计算 其 集中 趋势 。 所 谓 的 等 
比 资料 分 布 如 图 6-1 (A) 所 示 ， 第 见 的 有 抗体 滴 度 、 药 物 效 价 和 菌落 计数 ， 以 抗体 滴 度 
为 例 ， 常 见 数据 为 1 : 20、1 : 40、1 : 80 和 1 : 160 等 ， 这 类 数据 特征 为 后 面 数 据 取 
值 都 是 前 面 的 倍数 关系 ， 而 不 像 身 高 类 数据 ， 都 是 连续 性 一 点 点 递增 。 

几何 均 数 是 所 有 x 相 乘 ， 然 后 开 半 次 方 ， 式 〈6-2) ， 计 算 较 为 复杂 ， 一 般 都 是 通过 软 
件 计 算 。G 是 针对 正 偏 态 资料 集中 趋势 的 描述 。 适 用 范围 ， 对 数 正 态 分 布 资料 或 等 比 资料 。 


= (2) 
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4. 众 数 (mode) 
一 组 数据 中 ， 出 现 频次 最 多 的 那个 数 。 国 内 发 表 文章 较 少 使 用 ， 常 见于 外 文 论 文 。 
6.1.2 离散 趋势 


有 好 就 有 坏 ， 有 集中 就 有 离散 ， 上 面谈 了 计量 数据 的 集中 趋势 描述 的 指标 ， 同 样 其 
离散 趋势 也 有 特定 的 指标 加 以 描述 。 

1. 极 差 (range，R) 

既然 离散 反映 的 是 数据 的 分 散 性 ， 那 么 有 人 就 用 一 组 的 最 大 值 减 去 最 小 值 ， 得 到 数 
据 分 布 的 最 大 区 间 ， 这 个 指标 就 是 极 差 ， 如 图 6-2 所 示 。 

极 差 这 个 指标 非常 容易 理解 ， 但 因为 最 大 值 和 最 小 值 往 往 是 试验 误差 导致 ， 因 此 ， 
极 差 很 不 稳定 ， 不 得 已 方 用 之 。 

2. 四 分 位 数 间距 (quartile，Q) 

既然 极 差 指标 的 缺点 是 由 最 大 值 和 最 小 值 不 稳定 导致 ， 那 么 能 否 消除 其 影响 呢 ? 于 
是 有 人 就 将 数据 平均 分 为 四 等 分 ， 用 上 四 分 之 一 (Ps) 与 下 四 分 之 一 (Ps) 之 差 ， 来 反 
映 离散 趋势 ， 这 就 是 四 分 位 数 间距 指标 ， 如 图 6-2 所 示 。 

百 分 位 数 (percentile, P,) 是 指 将 一 组 数据 从 小 到 大 排序 , 位 次 居于 第 白 分 多 少 位 的 数 ， 
如 全 班 同 学 按照 映 高 从 矮 到 高 排序 ， 小 强 喘 高 176cm， 站 在 第 80 个 ， 则 该 班 刁 高 数据 的 
Pw 为 176cm。 


图 6-2 ” 极 差 与 四 分 位 煞 间 距 


四 分 位 数 间距 〈C) 也 很 容易 理解 ， 比 极 差 要 稳定 得 多 ， 但 是 也 有 缺点 ， 就 是 对 于 
一 组 数据 ， 不 管 你 样本 量 多 大 ， 仅 用 到 两 个 值 Ps 和 Ps 来 反映 整个 一 组 数据 的 离散 趋势 。 
肯定 会 犯 以 点 概 面 、 以 偏 概 全 的 错误 。 如 果 能 引入 一 个 指标 ， 可 以 把 一 组 数据 中 每 个 数 
据 的 离散 趋势 算出 来 并 求 和 和 ， 那 么 这 个 指标 就 比较 完美 。 

3. 方差 (go”) 

鉴于 上 述 情 况 ， 于 是 就 设计 出 离 均 差 和 ， 式 (6-3) 。 可 是 我 们 发 现 离 均 差 和 永远 等 
于 0， 我 们 计算 指标 是 用 于 比较 的 ， 但 是 任何 数据 的 离 均 差 和 均 为 0， 无 法 比较 。 为 什么 
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是 0 呢 ， 是 因为 会 出 现 正 负 抵 消 。 如 数据 1、2、3， 它 们 的 高 均 差 分 别 为 -1、0 和 +1， 
所 以 就 等 于 0 了 。 
y'(xz-A)=0 (6-3) 
继续 改进 公式 ， 如 果 让 原始 数据 的 离 均 差 取 平方 后 再 求 和 ， 不 就 可 以 消除 正 负 抵消 
产生 的 影响 了 吗 ? 于 是 产生 离 均 差 平 方 和 (sum of square，SS) ， 式 (6-4) 。 
WE 站 (6-4) 
此 时 貌似 已 经 完美 ， 可 是 如 果 一 组 数据 100 人 ， 一 组 数据 20 人 ， 如 果 要 计算 离 均 差 
平方 和 的 话 ， 人 多 的 数据 离散 性 肯定 要 大 呀 ， 人 多 难 管理 ， 心 不 齐 呀 。 看 来 样本 量 影响 
是 要 扣除 的 ， 咱 们 就 让 SS 除 以 各 自 的 样本 量 ， 于 是 就 得 到 了 总 体 方差 这 个 指标 。 
之 CO (6-5) 


n 


4. 标准 差 (0) 

方 莽 这 个 指标 考虑 了 每 个 数据 的 离散 趋势 ， 消 除了 负 号 以 及 样本 量 的 影响 ， 确 实 已 
经 不 错 了 ， 可 是 也 有 和 缺点: 因为 采用 平方 去 除 负 号 ， 导 致 离散 趋势 被 夸大 。 有 人 说 ， 
没关系 的 呀 ， 大 家 都 平方 了 ， 要 大 都 被 放大 ， 其 实 不 是 的 ， 因 为 被 放大 的 倍数 是 不 一 
样 的 。 

如 小 明 每 月 有 20 元 零花 钱 ， 小 强 每 月 有 30 元 零花 钱 ， 小 强 每 月 比 小 明 多 10 元 ; 如 
果 都 平方 ， 小 明 有 400 元 ， 小 强 有 900 元 ， 小 强 比 小 明 多 了 500 元 ， 不 再 是 10 元 ， 因 此 
扭曲 了 两 人 真实 的 差距 。 你 肯定 会 问 ， 那 我 们 怎么 办 呢 ? 很 简单 ， 再 开 方 呀 ， 作 用 就 是 
消除 负 号 ， 于 是 得 到 标准 差 ， 式 (6-6) 。 


这 之 人 -各 Fa 
n 


前 面 说 到 极 差 、 四 分 位 数 间距 、 离 均 差 平方 和 以 及 方 奔 ， 没 有 谁 敢 说 自己 是 标准 差 
的 , 既然 给 其 标准 差 的 定义 , 说 明 其 已 经 是 一 个 非常 完美 的 指标 了 , 为 什么 大 家 看 论文 时 ， 
只 要 符合 对 称 分 布 ， 都 用 标准 差 (S$) 来 描述 其 离散 趋势 呢 ? 你 是 否 记得 ， 很 多 文章 统计 
表 都 有 x 士 s 的 表示 方法 呢 ? 

再 次 重申 一 下 ， 总 体 标 准 差 用 c， 样 本 标准 差 用 s 表示 。 标 准 差 用 于 对 称 或 正 态 分 布 
数据 离散 趋势 的 描述 。 
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5. 变异 系数 (CV) 

貌似 到 第 4 步 标准 差 出 来 ， 应 该 结束 了 ! 但 当 度 量 衡 单位 不 一 样 的 数据 ， 以 及 单位 
一 样 但 均 数 相差 较 大 时 的 资料 离散 趋势 比较 不 可 以 用 标准 差 。 
如 某 班 级 学 生 身 高 数据 均值 为 160.0cm， 标 准 差 为 5.0cm， 体 重 数据 均值 为 50kg， 
差 为 4.0kg， 请 问 身 高 和 体重 数据 离散 性 哪个 大 呢 ?” 此 时 单位 cm 和 kg 是 没 法 比 的 。 
可 是 不 管 你 单位 如 何 ， 你 的 离散 趋势 是 存在 的 ， 正 如 松 哥 抓 了 一 把 沙 撒 地 上 ， 再 抓 
一 把 花生 撒 地 上 ,， 沙 和 花生 不 是 同一 样 的 东西 ， 可 是 它们 落地 上 ， 离 散 趋势 还 是 有 的 呀 ， 
我 们 比 的 就 是 离散 趋势 。 但 是 毕竟 它们 单位 又 不 同 怎么 办 呢 ? 

启发 思考 一 下 , 我 们 人 类 把 蚂蚁 比喻 为 大 力士 , 因为 蚂蚁 可 以 举 起 一 粒 大 米 的 重量 ， 
可 我 们 人 类 可 以 举 起 50kg 大 米 呀 ， 为 啥 不 说 人 类 是 大 力士 呢 ? 美国 科学 家 马克 莫 费 特 研 
究 发 现 蚂蚁 可 以 举 起 自身 体重 400 倍 的 重量 ， 而 我 们 人 类 以 及 其 他 动物 都 望尘莫及 。 所 
以 你 不 能 看 人 家 举 多 重 ， 还 要 看 人 家 自身 有 多 重 。 因 此 ， 当 度量 衡 单位 不 一 致 数据 离散 
趋势 比较 时 , 我 们 用 各 自 的 离散 趋势 标准 差 除 以 各 自 的 均 数 , 这样 便 能 很 好 地 实现 可 比 ， 
这 就 是 变异 系数 。 


标准 


CV = 这 x 100% (6_7) 


对 于 上 述 数 据 , 很 明显 身高 变异 系数 5/160 小 于 5/50, 因此 身高 的 变异 程度 (离散 趋势 ) 
小 于 体重 ! 


> 6.2 等 级 变量 


计量 数据 是 老大 ， 前 面 已 经 描述 完毕 ， 变 量 家 族 的 老 二 是 等 级 变量 ， 等 级 变量 描述 
可 以 用 中 位 数 、 秩 均值 和 众 数 。 中 位 数 前 面 已 说 ， 此 处 不 歼 。 秩 均值 的 意思 是 按照 数值 
大 小 排序 ， 然 后 提取 每 个 数据 的 位 次 〈 秩 次 ) ， 然 后 求 这 么 多 数据 的 秩 次 的 均值 ， 简 称 
秩 均值 。 这 在 后 面 非 参数 检验 会 用 到 。 众 数 〈(Mode) 是 一 组 数据 中 ， 出 现 频次 最 多 的 数 ， 
如 一 组 数据 1、2、2、2、3、4， 则 众 数 为 2。 


也 6.3 ”计数 变量 


计数 变量 为 老 三 ， 其 反映 数据 间 互 不 相 容 的 属性 和 类 别 。 对 于 老 三 描述 指标 有 率 、 
构成 比 和 相对 比 。 
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6.3.1 深 (rate ) 


率 是 指 在 一 定 范 围 内 某 现 象 实际 发 生 数 与 可 能 发 生 某 现 象 的 总 数 之 比 。 应 用 意义 为 
常用 于 判定 某 种 现象 发 生 的 强度 与 频率 。 简 单 点 就 是 实际 发 生 数 与 可 能 发 生 该 现象 的 观 
察 单位 数 之 比 ， 实 际 除 以 可 能 。 如 某 班级 100 人 参加 英语 六 级 考试 ， 实 际 通过 80 人 ， 则 
该 班级 英语 六 级 通过 率 为 80/100x100%=80%。 


6.3.2 构成 比 ( constituent ratio ) 


表示 事物 内 部 各 个 组 成 部 分 在 整体 中 所 占 的 比重 ,通常 以 100% 为 比例 基数 ， 以 百 
分 比 表示 。 局 部 除 以 全 体 。 应 用 意义 为 说 明 事物 内 部 各 部 分 所 占 的 比重 或 分 布 。 


6.3.3 ”相对 比 (relative ratio ) 


定义 为 两 个 有 关 的 指标 之 比 。 应 用 意义 为 说 明 两 个 指标 的 对 比 水 平 ， 即 一 个 指标 是 
男 一 个 指标 的 几 倍 或 百 分 之 几 。 

经 验 传授 

对 于 呈 对 称 分 布 的 计量 数据 ， 我 们 通常 采用 (x 土 s〉 表示 ， 而 对 于 偏 态 分 布 数据 常 
用 中 位 数 〈 四 分 位 数 间距 ) ， 即 M (OQ) 表示 ; 而 对 于 计数 数据 的 三 个 指标 中 ， 率 和 构 
成 比 在 统计 上 应 用 较 多 ， 常 可 以 进行 卡 方 检验 等 统计 分 析 。 计 量 和 计数 数据 更 为 常见 ， 
而 等 级 数据 分 析 更 容易 出 错 。 
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上 面 我 们 所 学 的 那么 多 的 统计 描述 指标 ， 往 往 是 放 在 一 个 表格 里 呈现 给 读者 ， 这 个 
表 就 是 统计 表 。 统 计 表 是 以 表格 的 形式 ， 表 达 被 研究 对 象 的 特征 、 内 部 构成 及 研究 项 目 
分 组 之 间 的 数量 关系 。 


> 7.1 统计 表 的 结构 


统计 表 的 基本 结构 包括 : 标题 、 标 目 、 线 条 、 数 字 以 及 备注 ， 见 图 7-1。 
标题 一 >， 表 13.1， 怀 疗法 治疗 前 后 中 医 证 候 积分 的 变化 Rss) 。 


纵 标 目 一 > 组 别 n 治疗 前 治疗 后 oe 
一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 -分 制 线 
针 推 组 30 16.63+2.87 4.57 圭 2.43** 调 
ms 针灸 组 30 17.00+2.60 6.43+2.22 加 数字 
推拿 组 30 16.90+2.68 6.47+2.06 底线 
备注 一 -> 注 : ** 与 针灸 组 比较 ，p<0.01， 检 与 推拿 组 比较 p<0.01 
图 7-1 统计 表 的 结构 
1. 标题 
标题 是 统计 表 的 名 称 ， 置 于 表 的 上 方正 中 ， 要 求 用 词 确切 ， 高 度 概括 ， 说 明 表 的 主 
要 内 容 。 必 要 时 注 明 资料 来 源 的 时 间 和 地 点 ， 有 多 张 表 时 需 加 编号 ， 编 号 与 标题 同行 ， 


放 在 标题 的 前 面 ， 编 号 用 〈 表 ) 加 上 阿拉 伯 数 字 表示 ， 如 “ 表 1”。 当 文中 只 有 一 张 表 时 ， 
可 以 写成 “ 附 表 ”。 

2. 标 目 

标 目 包 括 横 标 目 和 纵 标 目 ， 分 别 用 以 表示 表格 中 每 行 和 每 列 数字 的 意义 。 习 惯 上 ， 
将 被 描述 对 象 〈 常 按 类 别 、 属 性 等 分 组 ) 放 在 表 的 左边 ， 作 为 横 标 目 ， 是 表 的 主语 ， 纵 
标 目 位 于 表 的 右 侧 、 分 隔 线 以 上 , 说 明 横 标 目 的 标志 特征 或 统计 指标 的 内 容 , 是 表 的 谓语 。 
主语 和 谓语 连贯 起 来 能 读 成 一 句 完整 而 通顺 的 句子 ， 如 图 7-1 中 表 13-1 的 标题 。 在 实验 
设计 时 的 三 要 素 ， 受 试 对 象 、 研 究 因素 和 受 试 效应 中 ， 一 般 研 究 因素 作为 横 标 目 ， 实 验 
效应 作为 纵 标 目 。 复 合 表 的 纵 标 目 和 横 标 目 之 上 冠 以 总 标 目 。 标 目的 内 容 应 按照 顺序 排列 ， 
如 时 间 顺 序 、 地 区 的 自然 排列 、 事 物 的 重要 性 、 数 量 多 少 等 ， 以 利于 说 明 规 律 性 。 需要 时 ， 
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横 标 目下 面 、 纵 标 目 右边 可 设 有 合计 栏 。 

3. 线条 

统计 表 中 的 线条 力求 简洁 , 但 至 少 有 三 条 横 线 , 俗称 “三 线 表 ”, 顶 线 、 底 线 和 分 割 线 ， 
有 时 根据 需要 也 可 以 添加 合计 线 ， 其 余 的 线条 一 般 都 应 去 掉 。 表 格 中 不 宜 出 现 竖 线 和 和 斜 
线 ， 其 中 顶 线 和 底线 将 表格 与 文章 的 其 他 内 容 分 隔 开 来 ， 标 目 分 隔 线 将 标 目 的 文字 区 
与 表格 的 数字 区 分 隔 开 来 。 部 分 表格 还 可 添加 短 横 线 将 合计 分 隔 开 ， 或 将 两 重 纵 标 目 分 
割 开 。 

4. 数字 

表 内 数字 用 阿拉 伯 数 字 表示 ， 同 一 指标 的 数据 小 数位 数 应 该 保持 一 致 ， 并 且 小 数 点 
要 对 齐 。 表 内 不 能 留 有 空格 ， 如 有 缺失 常用 “…” 表 示 ， 用 “-” 表 示 无 数字 ， 数 据 为 0 
时 记 为 “0”。 

5. 备注 

表 中 不 列 备 注 项 ， 如 需 说 明 者 ， 可 在 右上 方 标 出 “*”“#?” 等 符号 ， 在 表 的 下 方 再 
以 注释 形式 说 明 。 


字 7.2 制 表 原则 


统计 表 一 般 遵 循 以 下 几 项 原则 。 

1. 重点 突出 ， 一 事 一 表 

即 一 张 表 一 般 只 表达 一 个 中 心 内 容 ， 不 要 把 过 多 的 内 容 放 在 同一 张 统计 表 中 ， 如 果 
容 较 多 ， 可 以 按照 不 同 的 内 容 对 表格 进行 拆 分 ， 制 备 多 个 表格 。 通 常 表 的 维度 不 超过 
3 维 ， 超 过 3 维 的 一 般 采 用 分 开 描 述 制 表 。 

2. 层次 清楚 

层次 清楚 要 求 标 目的 安排 和 分 组 要 合理 ， 符 合 逻 辑 ， 便 于 分 析 比 较 。 表 内 各 内 容 的 
排列 应 有 一 定 的 规则 。 对 有 统一 次 序 者 〈 如 疾病 严重 程度 ， 病 理 的 分 期 等 ) 应 该 按照 规 
定 的 次 序 排 列 ， 没 有 一 定 的 规定 次 序 者 可 按照 实物 的 重要 性 或 者 频 度 高 低 排 列 ， 对 变量 
频数 分 配 资料 可 按照 变量 值 的 大 小 排列 ， 把 变量 值 小 的 放 在 上 面 ; 不 同时 期 对 比 的 内 容 ， 
应 该 按照 时 间 顺 序 排列 。 

3. 简单 明了 

简单 明了 是 指 统计 表 中 的 一 切 文 字 、 数 字 和 线条 等 尽量 从 人 简 。 
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让 7.3 ”统计 表 分 类 


根据 说 明 事 物 主 要 标志 的 复杂 程度 ， 统 计 表 可 分 为 简单 表 和 复合 表 。 
1. 简单 表 
只 有 一 个 主语 和 一 个 谓语 组 成 的 表格 称 为 简单 表 ， 常 用 于 相互 独立 的 各 个 3: 
某 个 事物 不 同 水 平 间 的 比较 ， 如 图 7-1 所 示 ， 
2. 复合 表 
复合 表 中 主语 分 两 个 或 两 个 以 上 ， 并 与 谓语 结合 起 来 ， 见 表 7-1。 


表 7-1 不 同性 别 与 工种 肝癌 死亡 情况 
”男性 | ?2 | 8 | 037 | 1% | 1 | oo 
姓 | 1866 | 6 | 032 | 4 | 3 | 00 _ 
| 和 | | 0 | 6 | + | 0o% 


也 74 SPSS 定制 专业 统计 表 


物 或 者 


1. SPSS 默 认 格 式 

我 们 献 认 安 竣 SPSS， 进 行 统计 分 析 ， 打 开 data01.sav 数据 库 ， 氮 击 采 单 : 分 析 一 
较 均值 一 独立 样本 检验， 按照 图 7-2 设置 ， 确 定 运 行 ， 看 输出 的 表格 。 此 处 大 家 只 要 学 
着 设置 即 可 ， 该 方法 在 后 面 会 详细 讲解 。 图 7-3 为 分 析 结 果 的 统计 表 展 示 ， 正 规 的 统计 
表 简 称 “ 三 线 表 ”， 只 有 横 线 ， 没 有 坚 线 ， 可 是 默认 的 格式 显然 不 符合 。 


〗 分 组 变量 (G) : 


性 别 (1 2) 


图 7-2 独立 样本 1 检验 
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组 统计 


标准 误差 平均 
性 列 个 案 数 平均 值 示 堆 莽 值 


身高 男 303 | 170.092 | 5.5967 
女 287 | 158.347 | 5.1984 
独立 样本 检验 


药 立 方 着 等 同性 检验 平均 值 等 同性 t 检验 


一 一 一 一 一 一 一 
不 假定 守 放 下 26.428 | 587.778 0.000 11.7457 0.4444 | 10.8728 | 12.6186 


图 7-3 SPSS 默认 输出 表格 格式 


2. 设置 学 术 格 式 
表单 操作 : 编辑 一 选项 ， 弹 出 下 图 : 透视 表 一 Academic， 石 边 即 可 展现 近似 三 线 
表格 式 ， 如 图 7-4 所 示 。 


本 


表 外 观 (T) 1 
DPROGRA~1\spss24\Looks\Academic st AP 


和 一 一 一 一 一 一 一 一 一 
| |Academic | bbbb1 bbbbs 
Naylcsr lauormn EE | EEEE 


APA SansSerif 10pt 十 ddd 可 让 站 意 间 PFE PT 


APA_TimesRoma_12pt dddd1 cooo1 DO abed 


asongge 让 衣 站 站 Em 83.65 abed 


a3S0Ngge2z 站 让 在 让 | | abed |5853 abed 
asongge3 总 间 居间 全 abed abed 


asongge4 A sbod 


asomngges 


列席 
句 仅 峙 对 标签 进行 调整 (A) 
园 计 对 所 有 表 的 标签 和 数据 进行 调整 ( 山 


表 注释 
在 所 有 表 中 包括 注释 (C) 
注释 文本 (D) 


图 7-4 Academic 设置 
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再 按照 上 面 的 分 析 步 又 , 得 到 结果 如 图 7-5 所 示 。 结果 可 见 已 经 展现 为 三 线 表 的 格式 ， 
思 体 已 经 达 哩 人 意 了 ,但 古 细 心 的 你 会 及 现 , 项 线 和 展 线 为 双 线 , 还 征 不 对 , 需要 继续 议 首 。 


组 统计 
标准 误差 平均 

性 别 个 素数 平均 值 标准 兰 值 
导 商 明 303 170.092 5.5967 0.3215 

287 158.347 5.1984 0.3069 

独立 样本 检验 
例文 方差 等 同性 检验 平均 值 等 同性 { 检 能 
显著 性 ( 双 壮 值 95% 本 售 区 亲 一 
F 显 着 性 t 目 由 度 尾 ) 平均 值 差 值 ”标准 误差 差 什 下 限 上 限 

导 商 恒定 等 方 羡 0.438 0.509 26.315 588 0.000 11.7457 0.4453 10.8711 12.6204 

不 假定 等 方 善 26.428 5987.778 0.000 11.7457 .村 引 10.8728 12.6186 


图 7-5 Academic 设置 表格 


3. 操作 步骤 ;双击 结果 输出 窗口 的 统计 表 ， 和 右键 一 表 外 观 (Tablelook) ， 弹 出 窗口 
如 图 7-6 所 示 。 
按照 框 中 所 示 ， 分 别 把 上 内 框 和 下 内 框 调整 为 单 粗 线 ， 如 图 7-7 所 示 。 


表 半 观 : Academic 
表 站 驶 交 忻 全 ) : 


< 这 疾 轩 省 

< 演 内 和 读 首 > 

Academic 
AnaliticsPlatiorm 

APA SansSent 10pt 
APA_TIMesRoma_12pt 


re | Ga si El 
图 7-6 表 外 观 wm 


4. 此 处 重要 : 设置 完毕 ， 点 击 保存 类 型 为 “ 表 外 观 ”， 起 个 名 字 “asong”， 如 图 7-8 
所 示 ， 松 哥 起 的 以 a 开 头 方便 大 家 能 看 到 ， 请 看 左下 图 红 框 是 否 产生 一 个 asong 的 格式 。 
这 就 是 我 们 自 定义 生成 的 格式 啦 ! 当然 你 可 以 定义 一 个 你 上 自己 名 字 的 格式 ， 注 意 要 以 a 
开头 ， 容 易 找 到 。 
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CEE 


查找 位 置 几 : | 


证 ACadeImIIC.Si 忆 p 430N9g9ea.dtt 2 BIUeYEloWwContrastaternate. sttey Compac.stt 

ay AnalyticsPlatform.st a 30n9g9ed.5tt dy Classic.st 2 CompadcBowed.stt 
Ey APA Sansserit 10pt.st ES 30N9gges.dt ey assicAlternate st Ey Contrast st 

i APA_TimesRoma_ 12pt.st es as30nmgge6.stt 2 Cobalt.stt a Conirasthltemate.stt 
兴 》 250N9g9ge.5t 虑 5 Blue.st ey Cobaliiternate. st Ey defauli.stt 

Ey 230N9g9e2.5t 2 BlueYelloweontrast.st 2 CoballHeaders.at 党 Easter Egg.2tt 


图 7-8 ”保存 目 定 义 格 式 
5. 调用 目 定 义 格式 


染 作 步骤 : 再 次 进行 步骤 二 , 选择 asong, 应 用 一 确定 ! 再 分 析 测 试 一 下 看 看 ! 分 析 一 
均值 一 两 独立 检验 ， 结 果 如 图 7-9 所 示 ， 目 定义 格式 结果 ， 已 经 非常 标准 了 。 


组 统计 
和 标准 误 羡 平均 
性 别 个 素数 平均 值 标 , 礁 羡 值 
身高 田 303 170.092 5.5967 0.3215 
Ee 287 158.347 5.1984 0.3069 
独立 样本 检验 
葬 文 方差 等 同性 检验 平均 值 等 同性 检验 
显著 性 【 双 荐 值 95 和 症 信 区 则 
F 显 者 性 t 自由 度 尾 ) 平均 值 差 值 ” 标准 误差 差 慎 下 有限 上 限 
身 商 假定 竺 方差 0.438 0.509 26.375 588 0.000 11.7457 0.4453 10.8711 12.6204 
下 假定 等 方 童 26.428 587.7178 0.000 11.7457 日 4444 0.8728 12.6186 


图 7-9 自 定 义 格式 结果 


上 面 的 该 秆 发 表 文 重 或 着 毕业 论文 基本 可 以 了 ， 但 和 是 如 朱 十 PPT 汇报， 则 时 得 不 板 
了 些 ， 下 面 为 松 哥 目 定 义 分 析 结 果 ， 彩 色 的 字 并 添加 彩色 背景 ，PPT 汇报 非常 炮 酪 ， 想 
要 的 话 ， 只 要 关注 松 哥 的 微 信 公众 号 : data973， 然 后 消息 回复 : asongge， 自 动 拿 到 下 载 
链接 ， 然 后 复制 到 安装 目录 的 Looks 文件 夹 内 即 可 。 


组 经 计 


标准 吝 迁 
性别 个 率 数 ”平均 值 ” 标 朴 状 平均 位 
男 303 170.D92 与 5967 口 .32215 


身高 了 
区 
独立 样本 检验 
乖 文 方差 等 同性 检验 平均 值 等 同性 + 检验 
显 荐 性 ”平均 值 着 ”标准 误差 差 值 95% 笠 信 区 间 
F 时兴 性 t 自由 尾 。” 《 竣 尾 》 值 产值 下 限 上 限 

和 假定 等 方 巷 0.438 0509 26375 C588 0.000 11.7457 04453 10.B711 12.6204 
= fe] 


不 假定 等 方 准 | 


图 7-10 松 哥 自 定 义 格式 
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鸣 7.5 SPSS 统计 结果 展示 方式 


SPSS 可 以 在 分 析 菜 单 的 报告 (P) 菜 单 里 有 5 种 方式 (代码 本 、OLAP 立方 体 、 个 案 摘要 、 
按 行 报告 摘要 、 按 列 报告 摘要 ) 进行 数据 统计 描述 结果 ; 感 兴趣 的 读者 可 以 阅读 松 哥 编 
写 的 《SPSS 统计 分 析 大 人 全》 相关 章节 。 我 们 更 加 常用 的 是 SPSS 在 统计 分 析 后 结果 输出 
时 产生 统计 表 。 在 分 析 沫 单 的 表 (B) 荣 单 里 也 可 以 定制 报告 结果 ， 在 无 须 统 计 分 析 的 
情况 下 ， 直 接 输 出 统计 报表 ， 操 作 也 比较 方便 ， 下 面 以 一 个 例子 简单 前 述 。 

案例 : 以 data01.sav 数据 为 例 ， 制 作 不 同性 列 、 不 同学 员 学 生 的 吴 融 数据 ， 显 示 萤 
生 数 、 身 高 均值 和 标准 差 。 

操作 步骤 

Re 蛇 煤 和 层 ， 
伦 司 更 容易 理解 ， 然 后 将 性 别 和 学 院 直 接 拖 入 行 ， 身 高 拖 入 列 。 


LE 


er 二 和 
ae 
到: i 


| we 


车) | 源 (U) : | 副 变 量 ™ 


图 7-11 定制 表 设 置 


变量 ， 但 没 指出 要 分 析 变 量 的 哪些 统计 指标 ， 此 步 目的 就 古 


上 面 是 选择 分 析 的 有 
身高 计量 资料 ， 本 例 想 知道 样本 量 、 均 数 和 标准 差 ， 当 然 如 


要 得 到 哪些 统计 指标 ， 对 


| 第 7 章 统 计 表 | 071 


果 你 还 想 知 道别 的 变量 ， 自 行 勾 选 即 可 。 
点 击 “ 喘 高 ”， 然 后 再 点 击 如 图 7-11 所 示 的 “摘要 


i 要 统计 ”， 弹 出 图 7-12， 将 左 
侧 咀 们 需要 的 指标 选 入， 反击 “应 用 于 所 选项 ” 即 可 。 确 定 即 可 获得 统计 表格 ， 见 图 
7-13。 


:计数 的 CL 
-计数 的 标准 误差 
未 加 要 计数 

人 未 加 要 计数 的 CL 下 限 
:和 未 加 根 计 数 的 CL 上 限 
和 来 加 根 计 莉 的 标准 误差 
:上 .调整 后 计数 

i 计 N 

总 计 N 的 CL 下 限 


图 7-12 ”摘要 统计 设置 


和 
平均 值 ”标准 着 ”计数 
公 卫 169.1 可 139 
护理 
基础 本 让 4 日 区 | 
六” 插 院 口腔 
仁科 部 169.6 二 30 
生物 技术 [和 
性 别 z 
护理 158.0 5.0 昌 4 
基 仙 | 
站 学院 口腔 和 蝇 克 晤 | 2 
+ 
生物 技术 让 吕 玫 | 并 名 
卫 筷 


图 7-13 ”摘要 统计 结果 
在 无 须 统 计 分 析 的 情况 下 , 定制 表 制 作 更 为 快捷 与 灵活 ， 但 定 4 


让 
常规 都 是 统计 分 析 后 的 统计 表 进 行 应 用 发 表 。 但 定制 表 也 可 以 进行 统计 分 析 ， 因 为 小 众 ， 


表 一 般 使 用 也 不 多 ， 


此 处 不 歼 ， 感 兴趣 的 读者 可 以 点 击 图 7-11 的 “检验 统计 ”按钮 ， 尝 试 一 下 吧 ! 


为 了 大 家 阅读 方便 ,本 书 编辑 将 很 多 统计 表 转 换 为 数据 表格 形式 ， 非 规范 的 统计 3 
符 此 说 明 。 


Eh 
党 
+ 
Se 
导 p by 


统计 分 析 最 终 成 果 的 展现 形式 只 有 两 种 一 一 统计 表 与 统计 图 。 统 计 表 其 实 就 是 对 统 
计 分 析 得 到 的 指标 进行 表格 集成 , 只 要 选择 正确 的 统计 分 析 , 用 得 到 的 指标 进行 制 表 即 可 。 
一 般 不 会 太 难 ， 更 何况 ， 很 多 时 候 软 件 上 自动 将 统计 表 生 成 ， 只 需 稍 加 整理 。 统 计 图 是 统 
计 分 析 结 果 表达 的 重要 工具 ， 它 通过 线段 的 升降 、 操 的 位 置 、 直 条 的 长 短 、 面 积 的 大 小 
来 表现 事物 间 的 数量 关系 。 使 用 统计 图 可 形象 、 直 观 、 生 动 的 描述 统计 资料 的 相关 信息 ， 
广泛 应 用 于 资料 的 收集 、 整 理 及 研究 结果 的 对 比分 析 。 一 张 好 的 统计 图 能 够 准确 、 直 观 
地 呈现 统计 结果 ， 给 读者 留 下 深刻 印象 。 业 界 有 句 话 “一 图 胜 千 言 ”， 由 此 可 见 统计 图 
的 重要 性 ， 在 这 个 既 看 才华 又 看 颜 值 的 时 代 ， 统 计 作 图 本 领 显 得 格外 的 重要 。 


也 8.1 SPSS 24.0 绘图 功能 简介 


打开 要 分 析 的 数据 文件 ， 单 击 “ 图 形 ” 沫 单 ， 如 图 8-1 所 示 。 我 们 可 以 看 到 下 拉 
菜单 包括 “图 表 构 建 器 ”“ 图 形 画 板 模板 选择 器 ”及 “ 旧 对 话 框 ”， 其 中 “ 旧 对 话 框 ” 
又 包括 常用 的 11 种 图 形 。 统 计 图 形 除 通 过 “图 形 ” 六 单 直接 实现 外 ， 部 分 图 形 还 会 
伴随 其 他 分 析 过 程 而 输出 ， 如 描述 分 析 中 的 “频数 ”过 程 、 回 归 分 析 过 程 、 时 间 序 列 
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8.1.1 图 表 构 建 锅 简介 


SPSS 24.0 的 图 形 儿 乎 完全 可 以 通过 鼠标 的 拖拉 过 程 来 实现 图 形 的 绘制 工作 。 先 选择 
图 形 的 类 型 ， 然 后 从 类 型 库 中 选择 目 己 想 要 输出 的 图 形 揪 述 ， 通 过 将 不 同 的 变量 名 拖 入 
对 应 的 坐标 轴 ， 用 户 可 以 绘制 各 种 统计 图 形 。 

步 又 如 下 : 打开 要 分 析 的 数据 文件 , 在 米 音 中 依次 单 击 “ 图 形 "一 “图 表 构 建 器 ”命令 ， 
弹出 “图 表 构 建 占 ”对 话 框 ， 如 图 8-2 所 示 。 

我 们 可 以 通过 “图 表 构 建 器 ” 束 能 根据 预定 义 的 图 库 图 表 或 图 表 的 旱 独 部 分 生成 图 表 ， 
“图 表 构 建 研 ”对话 框 包 括 如 下 几 部 分 。 

1.“ 变 量 ”列表 

位 于 图 8-2 严 上 角 ， 该 列表 显示 了 “图 表 构 建 问 ” 所 打开 的 数据 文件 中 所 有 的 可 用 
变量 ， 如 采 选 择 该 列表 中 的 分 类 变量 ， 则 “类 别 列表 ”会 显示 该 变量 已 经 定义 的 类 别 。 
我 们 还 可 以 通过 右键 单 击 茶 个 变量 ， 然 后 选择 一 个 测量 级 别 以 适合 作 图 ， 如 图 8-3 所 示 。 
此 步 操作 仪 对 作 图 有 效 ， 不 会 改变 原始 数据 中 的 数据 测量 突 别 。 


请 择 图 库 中 的 图 志学 到 此 处 ， 上 以 择 其 用 作 起 点 
或 者 

单 击 “ 礁 下 元 率 " 洁 项 卡 点 便 挝 个 元 素 址 攀 强 图 表 
加 显示 挛 量 名 种 (0) 
显示 变量 标签 (L) 
按 字 母 顺 床 排 列 (A) 
加 控 文件 顺序 排序 (F) 
按 度 量 水 平 排列 (M) 

变量 信息 (V) 

名 网 (N) 
斥 写 (0) 
加 度量 [S) 

Lat ||he, Esay lal el 复制 (C) ctrhC 


图 8-2 “图 表 构 建 问 ”对 话 框 图 8-3 ”变量 属性 列表 


2 . “ 男 布 ” 

“画布 ”位 于 “图 表 构 建 问 ”对 话 框 的 右上 角 ， 如 图 8-2 所 示 。 作 图 时 ， 我 们 可 以 
将 图 库 图 表 或 者 基本 元 素 拖 放 到 画布 上 以 生成 图 表 ， 一 旦 有 图 库 图 表 或 基本 元 系 被 拖 放 
到 “ 男 布 ”， 使 会 生成 预 宛 。 
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3. 轴 系 

轴 系 是 指 特定 坐标 空间 中 的 一 个 或 多 个 轴 。 我 们 在 将 图 库 项 拖 入 “展示 区 ”时 ，“ 图 
表 构 建 器 ”会 自动 创建 轴 系 。 用 户 也 可 以 从 “基本 元 素 ” 选 项 中 选择 一 个 轴 系 ， 每 个 轴 
系 旁 边 都 包含 一 个 轴 变 量 放置 区 ， 放 置 区 呈现 蓝 色 时 ， 表 示 该 区 域 需 要 放置 变量 。 每 个 
图 表 都 需要 添加 一 个 变量 置 x 轴 变 量 放置 区 。 

4.“ 库 ”选项 卡 

“ 库 ” 选 项 卡 位 于 图 8-2 的 左下 角 , 具体 如 图 8-4 所 示 。“ 选 择 范 围 ” 列 表 框 涵盖 了 “图 
表 构 建 器 ”可 以 绘制 的 各 种 图 形 及 收藏 来， 当 单 击 “ 选 择 范围 ”中 某 一 图 表 类 型 时 ， 厂 
侧 即 显示 该 图 表 类 型 的 所 有 可 用 图 库 。 用 户 可 以 单 击 选中 所 需 的 图 表 类 型 ,将 其 拖 入 “ 面 
布 ”， 也 可 双击 将 所 需 图 表 放 入 “展示 区 ”。 如 果 “ 展 示 区 ”已 经 有 图 表 ， 则 会 自动 蔡 代 ， 
当然 原先 “画布 ”的 图 表 也 可 以 用 右键 单 击 ， 在 出 现 的 窗口 选择 “清除 画布 ”。 


_ WE |] He) EB) i Gs 
图 8-4 “ 库 ” 选 项 卡 


5$.“ 基 本 元 素 ” 选 项 卡 

在 “图 表 构 建 器 ”对 话 框 中 单 击 “ 基 本 元 素 ”， 打 开 图 8-5 所 示 的 “基本 元 素 ” 选 
项 卡 界面 。 里 面包 括 左 侧 5 种 选择 轴 和 右 侧 的 10 种 图 形 元 素 。 一 般 用 户 先 将 选择 轴 拖 
入 “画布 ”， 再 将 “选择 元 素 ” 拖 入 “画布 ”。 需 要 注意 的 是 ， 并 不 是 所 有 “选择 元 素 ” 
都 可 以 用 于 上 述 5 轴 ， 每 种 轴 系 只 支持 特定 的 元 素 。 另 外 对 于 初次 使 用 用 户 建议 使 用 
“图 库 图 表 ”， 因 为 “图 库 图 表 ” 能 够 自动 设置 属性 并 添加 功能 ， 可 以 简化 创建 图 表 的 
过 程 。 

6.“ 组 /点 ID” 选 项 卡 

在 “构建 图 表 程 序 ” 对 话 框 ， 单 击 “ 组 /点 ID” 选 项 卡 ， 如 图 8-6 所 示 。 若 勾 选 
“组 /点 ID” 选 项 卡 中 的 某 个 复 选 框 ， 将 会 在 “画布 ”中 增加 相应 的 一 个 放置 区 ; 若 取 
消 一 个 复 选 框 ， 将 会 取消 “画布 ”中 相应 的 放置 区 。 
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选中 的 项 会 将 拖 放 区 域 湛 加 到 可 对 其 分 配 守 量 的 画 市 。 


X 轴 上 的 分 群 窑 量 
国 二 轴 上 的 分 群 空 量 
行 典 板 空 量 (R) 
过 ) 
国 指定 D 村 尝 


nl [二 证 || 下 WP) Pro 
图 8-5 “基本 元 素 ” 选 项 卡 图 8-6 “组 /点 ID” 选项 卡 

7.“ 标 题 /脚注 ” 

在 “构建 图 表 器 ”对 话 框 , 单 击 “标题 /脚注 ”选项 卡 , 如 图 8-7 所 示 。 用 户 通过 勾 选 “ 标 
题 / 脚注 ”选项 卡 中 界面 中 的 复 选 框 ， 并 在 右 侧 弹出 的 “元 系 属 性 ”对 话 框 中 的 “内 容 ” 
文本 框 中 输入 相应 标题 名 或 脚注 名 ， 然 后 单 击 “ 应 用 ”按钮 ， 就 可 使 输出 的 图 形 添加 标 
题 或 脚注 ， 同 理 通过 取消 复 选 框 可 以 去 除 已 经 设置 的 标题 或 脚注 。 


选中 的 项 会 将 标题 和 脚 广 诉 加 于 |l 国 表 。 请 在 ' 坊 性 ' 中 编辑 交 本 。 


加 | 标题 1 
四 标题 2 
因子 是 
同上 脚注 1 
同 脚注 2 


| 硝 定 | | 直 丫 口 | 荐 本 史 攻 区 


图 8-7 “标题 / 脚注 ”选项 卡 


8.“ 元 素 属 性 ”按钮 

单 击 “图 形 构 建 器 ”对 话 框 中 “元 素 属 性 ”按钮 ， 弹 出 如 图 8-8 所 示 的 对 话 框 。 

在 “编辑 属性 ”列表 中 ， 显 示 可 以 进行 属性 设置 的 图 形 元 素 ， 图 8-8 所 示 中 包括 条 、 
X-Axisl]、Y-Axisl 和 GroupColor。 每 一 种 图 形 元 素 可 以 设置 的 属性 一 般 不 同 ， 用 户 按 照 
预定 目标 对 相应 元 素 进行 属性 设置 。 点 击 图 8-2“ 图 表 构 建 器 ”对 话 框 右 侧 的 “选项 ” 
按钮 ， 弹 出 图 8-9“ 选 项 ”按钮 设置 ， 使 用 者 可 以 对 缺失 值 与 汇总 统计 量 和 个 案值 进行 
设置 。 
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骨 户 执法 人 
总 时 排除 系统 者 失 值 ， 但 是 瓷 可 以 指定 希望 SPSS Statsiics 处 理 用 户 衣 
7 共 情 的 方式 * 


xX-Axis1 ( 染 (B)1) 
1Y-Axis1 (条 (B)1) 
GroupCaolor (如 (B})1) 


HET 


指针 列表 ， 为 图 吉 著 职 一 于 的 个 察 库 届 ) 
日 拓 六 汉 个 这 量 ， 晤 大 化 数据 的 使 用 率 (V) 


显 不 误 儒 条 形 图 (E) 
三 误差 条 图 的 表征 - 如 果 在 SPSS Statistics 选 需 中 已 后 定 竟 概 《可 芷 数据 编辑 寻 的 铺 辑 ' 荣 单 灰 


的 误差 条 图 的 表征 职 | ， 将 首 革 合用 它 。 然 后 已 习 查 鸭 械 概 将 按 下 方 列表 的 顺序 应 用 * 


级 别 (WHL): |95 


epinial 
可 
司 ye 
T 
ED 


[ 详 帮 一 个 旧 疡 总 可 芝 表 克 贞 站 ) 


图 8-8 


9.“ 选 项 ”按钮 

(1) 分 组 变量 。SPSS 在 处 理 分 组 变量 缺失 值 时 包括 两 种 方法 ，“ 排 除 ” 是 指 绘 
图 时 忽略 用 户 定 义 的 缺失 值 ;， “包括 ”是 指 绘图 时 把 缺失 值 作 为 一 个 单独 的 类 别 加 以 
统计 。 

(2) 汇总 统计 量 和 个 案值 。 若 选择 “排除 列表 ， 为 图 表 获 取 一 致 的 个 案 率 ”， 则 表 
示 绘 图 时 直接 忽略 这 个 观测 ， 若 选择 “排除 逐个 变量 ， 最 大 化 数据 的 使 用 率 ”， 则 表示 
只 有 包含 缺失 值 的 变量 用 于 当前 计算 和 分 析 时 才 和 忽略 这 个 样本 。 

(3) 模板 文件 。 该 列表 框 用 于 对 绘图 时 的 模板 进行 设置 。 绘 图 时 最 先 使 用 默认 的 模 
板 文件 ， 也 可 以 通过 单 击 “ 添 加 ”按钮 ， 打 开 文件 选择 对 话 杠 ， 添 加 指定 的 文件 预 置 模 
板 文件 。 

(4) 图 表 大 小 与 租 板 。 图 表 大 小 用 于 设置 图 形 生成 的 大 小 , 默认 值 为 100%; “ 购 板 ” 
用 于 图 形 列 数 过 多 时 的 显示 设置 。 阁 勾 选 “换行 艇 板 ” 复 选 杠 ， 则 表示 图 形 列 数 过 多 时 
允许 自动 换行 ， 否则 图 形 列 数 过 多 ,每 行 上 的 图 形 会 自动 缩小 以 显示 全 部 。 设 置 完毕 后 ， 
单 击 “确定 ”按钮 后 返回 主 对 话 框 。 
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8.1.2 ”图 形 画 板 模 板 选 择 程序 


在 8.1.1 小 厅 “ 图 形 构 建 程序 ”中 ， 用 户 构 建 图 表 时 ， 自 先 得 根据 目的 与 痪 料 类 型 ， 
在 图 库 中 先 选择 未 种 图 形 ， 再 进行 轴 系 的 添加 。 当 用 尸 不 知道 应 该 选择 何 种 图 库 图 形 时 ， 
和 住人 往 不 家 操作 。 和 而 “图 形 男 板 模板 选择 程序 ” 则 与 “图 形 构 建 程序 ”过 程 相 反 ， 用 户 可 
以 先 选择 “基本 ”选项 卡 中 变量 列表 中 的 变量 ，SPSS 24.0 根据 变量 的 类 型 与 个 数 会 目 动 
师 选 出 可 以 绘制 的 图 形 , 用 尸 可 以 在 图 形 中 进行 选择 , 壕 过 程 与 Excel 作 图 过 程 较 为 类 似 。 
图 8-10 所 示 为 “图 形 男 极 模板 选择 费 ” 对 订 框 。 在“ 图形 画板 模板 选择 般 ” 对 话 框 中 ， 
包 澡 “基本 ”“ 详 细 ” “标题 ”及 “选项 ”四 个 选项 卡 。 


外 列表 中 选择 以 开 知 。 
请 按 住 Ci 并 单 击 以 选择 移 顶 。 


摘要 人) [weeeeeeeeeeeaeeaaenamena 


位置 。 | 本 地 计算 机 


图 8-10 “图 形 画 板 模 板 选 择 句 ”对 话 框 

1.“ 基 本 ”选项 卡 

当 用 户 不 清楚 目 己 所 需 的 图 形 时 ， 可 以 选择 “基本 ”选项 卡 ， 当 用 刀 单 击 “ 基 本 ” 
选项 卡 变 量 列表 中 的 和 个 或 多 个 变量 时 ， 访 变量 所 能 绘制 的 图 形 束 会 展示 在 右 侧 的 图 形 
类 型 展示 区 。 

(1) 变量 列表 。 选 择 “ 奉 本 ”选项 卡 后 ， 所 打开 的 数据 库 中 所 有 变量 将 显示 在 变量 
列表 中 。 用 尸 可 以 选择 变量 列表 框 上 部 “ 目 然 "“ 名 称 ” 和 “类 型 ” 单 选项 对 变量 进行 排序 。 
当 用 尸 选 择 条 个 变量 或 按 Ctrl 刍 选 择 多 个 变量 时 ， 相 应 变量 可 以 绘制 的 图 形 束 会 展示 出 
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来 。 

(2) “摘要 ”下 拉 菜 单 。 摘 要 统计 量 包 括 和 、 均 值 、 极 小 人 
观 展 示 时 的 摘要 统计 。 

2.“ 详 细 ” 选 项 卡 

“图 形 画 板 模 板 选 择 器 ”对 话 框 中， 选择 “详细 ”选项 卡 ， 弹 出 界面 如 图 8-11 所 示 。 

(1) 视 化 类 型 。 用 户 单 击 打 开 可 视 化 图 形 下 拉 列 表 ， 选 择 好 图 表 类 型 后 ， 界 面 将 自 
动 显 示 所 选 的 图 形 ， 当 用 户 在 “基本 ”选项 卡 中 己 经 选择 东 种 图 形 ，“ 主 细 ” 选 项 卡 将 
显示 葬 图 形 。 

(2) 选择 性 审美 标准 : 

(3) 面板 与 动画 : 该 先 
图 形 。 

3.“ 标 题 ” 选 项 卡 

“图 形 男 板 模板 选择 程序 ”对 话 杠 中， 选择 “标题 ”选项 卡 ， 弹 出 界面 如 图 8-12 所 
示 。 当 用 万 选 摔 定 名 框 时 ， 会 出 现 “标题 ”“ 副 标题 ”和 “脚注 ”三 个 对 话 框 ， 


证 标题 复 选 
用 户 可 以 自行 设置 输入 。 


和 极 大 值 ， 用 以 进行 耳 


舍 三 个 对 话 框 ， 分 别 设置 “颜色 ”“ 形 状 ” 和 “透明 度 ”。 
项 用 以 选择 面板 变量 和 动画 变量 ， 从 而 使 用 户 得 到 个 性 化 的 


Cr 


可 视 忆 标题 


| 送 择 册 图 交 忻 出) 


ED ED 
[Jj mo 基 四 项 国 匡 国 mr | 


图 8-11 “详细 ”选项 卡 图 8-12 “标题 ”选项 卡 


4.“ 选 项 ”选项 卡 
“图 形 画 板 模板 这 


拌 程 厅 ” 对 话 框 中 , 选择 “选项 ”选项 下 , 弹出 看 面 如 图 8-13 所 示 。 
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| | 输出 标签 将 显示 在 输出 查看 器 的 大 纲 窗 格 中 


个) 48 才 排除 条 统 册 和 失 值 ， 但 是 您 可 以 指定 SPSS Statistics 处 理 用 户 缺 失 值 的 方式 。 


分 界 训 量 捕 要 统计 和 个 案值 ] 
@ 排队 下) 加 成 列 排 除 ， 以 确保 图 表 的 个 案 库 保 持 一 致 上 T) 
名 包括 {N) 全 逐个 变量 进行 排除 ' 以 便 最 大 限度 地 使 用 数据 (V) 


ED 
图 8-13 “选项 ”选项 卡 


用 户 可 以 单 击 ee 右 侧 框 设 置 在 指定 “浏览 器 ”中 出 现 的 和 输出 标签 “样式 表 ” 
下 和 面 的 “选择 ” 控 钮 可 以 设置 可 视 化 的 样式 属性 ;用 尸 喘 失 值 可 从 设置 分 析 数据 出 现 全 
失 值 的 处 理 方式 。 

出 于 篇 幅 原因 , “图 表 构 建 器 ”和 “图 形 画 板 模 板 选 择 器 ” 仅 作 功能 与 菜单 上 的 阐述 ， 
本 草 后 面部 分 我 们 将 采用 “ 旧 对 话 框 ”进行 讲解 。 


> 人 


条 形 图 ， 也 称 直 条 图 (bar chart) ， 简 称 条 图 ， 适 用 于 相互 独立 的 分 组 资料 。 以 等 宽 
耳 条 长 段 的 比例 代表 各 相互 独立 指标 的 数值 及 它们 之 间 的 对 比 关系 ， 所 比较 的 资料 可 以 
是 绝对 数 , 也 可 以 是 相对 数 。 直 条 图 分 为 单 式 条 形 图 ( 见 图 8-14)、 复式 条 形 图 ( 见 图 8-15) 
和 堆积 条 形 图 ( 见 图 8-16) 三 种 。 
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4000 


ej 3000 


ey 

站 2000 
3 
”1000 


妇幼 护理 基础 口腔 临床 全 科 生物 卫 管 心理 医 检 预防 
技术 


专业 
图 8-14 不 同 专业 大 学 生 肺 呼 量 


5000 性 别 
国内 
4000 口 女 
室 3000 
雪 
R2000 
1000 


0 
妇幼 护理 基础 口腔 临床 全 科 入 卫 管 心理 医 检 预防 


专业 
图 8-15 不 同 专业 不 同性 别 大 学 生 肺 呼 量 


性 别 
6000 
通 4000 
六 
| | | | Ey 
2000 | 本 
0 二 下 四 | | | | 四 | | 


妇幼 护理 基础 口腔 临床 心理 医 检 预防 


专业 
图 8-16 不 同 专业 不 同性 别 大 学 生 肺 呼 量 
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8.2.1 统计 图 的 结构 


从 图 8-14、 图 8-15 和 图 8-16 可 以 看 出 ， 统 计 图 的 基本 结构 如 下 所 述 。 

(1) 图 域 ， 作 图 空间 。 取 纵横 坐标 的 交点 为 起 点 ， 以 第 一 象限 为 作 图 区 ， 图 域 的 长 
宽 比 例 一 般 为 7 : 5 或 者 5 : 7 

(2) 标题 :概括 统计 图 的 内 容 。 标 题 应 简明 扼要 ， 告 知 统计 图 资料 来 源 的 时 间 、 地 
点 及 主要 内 容 ， 其 位 置 一 般 在 图 的 正 下 方 ， 同 时 标题 前 要 标注 图 形 的 编号 。 

(3) 标 目 : 描述 图 所 描述 的 事物 或 指标 。 纵 标 目 和 横 标 目 分 别 放置 在 纵 轴 的 左 侧 和 
横 轴 的 下 方 ， 并 分 别 指明 纵 、 横 标 目 所 代表 的 指标 和 单位 。 

(4) 刻度 : 纵 轴 和 横 轴 上 的 华 标 。 刻 度数 值 按 从 小 到 大 的 顺序 排列 ， 常 用 算数 尺度 
和 对 数 尺度 ， 分 别 列 在 纵 轴 外 侧 和 横 轴 下 侧 。 

(5) 图 例 : 针对 复杂 统计 图 内 不 同事 物 和 对 象 ， 需 要 用 不 同 图 标 、 颜 色 和 线形 加 以 
区 分 ， 并 附 图 例 加 以 说 明 。 图 例 一 般 放 在 图 域 的 空隙 处 。 


8.2.2 统计 图 的 绘图 原则 

绘制 统计 图 的 原则 是 : 合理、 精确、 简明、 协调 。 不 同 的 统计 图 的 适用 条 件 和 表达 
的 信息 均 不 相同 ， 应 根据 资料 的 类 型 和 分 析 目 的 合理 地 选用 统计 图 ， 此 外 ， 统 计 图 应 满 
足 视 觉 美观 的 要 求 。 

8.2.3 统计 图 形 的 选择 


应 根据 资料 特征 和 分 析 目 的 选择 合适 的 统计 图 ， 但 研究 者 还 可 以 根据 具体 情况 设计 
其 他 类 型 的 统计 图 进行 资料 描述 ， 如 图 8-17 所 示 。 


用 点 的 趋势 和 密集 度 标示 两 变 最 的 和 百 关 系 
用 直 条 的 高 度 或 面积 表达 各 组 段 的 频率 或 者 频数 
双 变 量 资料 用 于 观察 变量 是 否 随时 间 变 化 而 呈现 某 种 趋势 


图 8-17 ”常用 统计 图 形 的 选择 
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8.2.4 ”模块 解读 
1. 单 式 直 条 图 
例 8.1: 现在 某 高 校 随机 抽取 600 名 大 学 生 ， 检 测 大 学 生 身高 、 体 重 等 基础 资料 ， 
以 对 不 同 专业 大 学 生 的 肺 呼 量 进行 可 视 化 展示 ， 制 作 条 形 图 。 

| (1) 单 击 “ 图 形 ” 一 “ 旧 对 话 框 ”一 “条 形 图 ”命令 ， 弹 出 条 形 
[用 攻 图 对 话 框 ， 如 图 8-18 所 示 。 条 图 类 型 可 分 为 简单 条 图 、 复 式 条 形 图 和 
上 | 堆积 面积 图 。 

TT | QD 简单 条 图 ， 也 叫 单 式 条 图 ， 用 于 表现 单个 指标 的 大 小 , 如 图 8-14 
] Nal | 所 示 ; 

es 是 复式 条 图 ， 也 叫 分 组 条 图 ， 用 以 表现 两 个 或 多 个 分 组 因素 间 的 
2 某 指标 的 大 小 关系 ， 如 图 8-15 所 示 ; 

[aaa 四 堆积 面积 图 ， 也 叫 堆积 条 图 、 分 段 条 图 。 用 于 表现 每 个 直 条 中 
| | 某 个 因素 各 水 平 的 构成 情况 ， 如 图 8-16 所 示 。 

图 8-18 条 形 图 对 (2) “图 表 中 的 数据 为 ”对 话 框 ， 该 对 话 框 有 三 个 选项 : 

话 杠 @ 个 案 组 摘要 : 按 同 一 变量 不 同 取 值 作 分 组 汇总 。 该 模式 对 应 分 
类 变量 中 的 每 一 类 观测 值 生成 一 个 单 式 条 图 ; 

四 各 个 变量 的 摘要 : 按照 不 同 变量 汇总 。 对 应 每 个 变量 生成 一 个 直 条 ， 至 少 需 要 两 
个 或 两 个 以 上 变量 的 生成 相应 的 条 图 ; 

轿 个 案值 ， 反 映 了 个 体 观测 值 。 对 应 分 类 轴 变 量 中 每 一 个 观测 值 生成 一 个 直 条 。 

(3) 单 击 “ 简 单 ” 一 “个 案 组 摘要 ”一 “定义 ”命令 ， 弹 出 条 图 的 主 对 话 框 ， 如 图 
8-19 所 示 。 其 中 对 话 框 左 侧 为 通用 的 候选 变量 列表 框 ， 右 侧 “ 条 的 表征 ”中 ，“ 个 案 数 ” 
是 按 记 录 个 数 汇总 ，“ 个 案 数 的 %” 是 按 记 录 数 所 占 百分比 汇总 ，“ 累 积 个 数 ” 是 按 昧 
计 记 录 数 汇总 ，“ 累 积 %” 是 按 记 录 数 所 占 累 计 百分比 汇总 ， 如 果 以 上 几 种 函数 不 满足 
要 求 , 你 可 以 选择 “其 他 统计 量 ”, 将 相应 的 汇总 变量 先入 下 方 的 变量 框 , 单 击 下 方 的 “更 
改 统计 量 ” 进 行 汇总 变量 的 详细 定义 ， 如 图 8-20 所 示 ， 统 计量 指标 不 再 一 一 闭 述 ， 此 处 
选 入 “ 肺 呼 量 ”， 软 件 默认 为 均值 。 

(4) “类 别 轴 ”， 即 条 图 的 横 轴 ， 用 于 选择 所 需 的 分 类 变量 ， 此 处 必须 选 入 变量 ， 
将 变量 “专业 ” 选 入 。 
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项 站 康 百 分 比 拘 
总 四 计 百 芝 比 册 ) 


变星 : 
zs MEANO0 肺 呼 县 
RE 


名 值 的 中 位 数 {Q) 

总 值 的 次数 局 ) 

名 个 案 数 (3) 

全 省 的 总 和 (FE) 加 累计 求 和 (UU) 
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I [esr | 


国 嵌 大 变星 i 元宝 行 ; tE) 
SL) : 鲍 上 方 百分比 (P) 
| 个 下 方 百分比 伦 ) ”总 下方 数目 但) 
加 百 分 位 数 [I) 
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加 区间 内 百分比 丛 ) 如 区 和 间 内 数目 (E) 


国 迪 套 到 旺 (元 空 F1) 人 


图 信号 分 组 中 点 山 


一 一 一 


图 8-19 条 形 图 主 对 话 杠 

(5) “面板 依据 ”对 话 框 指 的 是 在 图 域 中 一 次 制作 多 个 分 类 的 单 式 条 图 ，“ 行 ”对 

话 框 中 若 选 入 变量 “性 别 ”， 则 会 在 两 行 中 展示 不 同性 别 、 专 业 大 学 生 的 肺 呼 量 均值 直 条 ， 

如 图 8-21 所 示 ， 若 将 变量 “性 别 ” 选 入 “ 列 ” 对 话 框 ， 则 会 在 同一 行 中 分 两 列 展示 不 同 
性 别 、 专 业 大 学 生 的 肺 呼 量 均值 直 条 ， 如 图 8-22 所 示 ， 
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妇幼 护理 基础 口腔 临床 全 科 卫 管 心理 医 检 预防 
专业 
图 8-21 将 性 别 拉 入 面板 依据 中 的 行 对 话 框 
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性 别 
男 女 

3000 

4000 

拔 3000 
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1000 
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专业 
图 8-22 将 性 别 拉 入 面板 依据 中 的 列 对 话 框 后 
(6) “图 表 规 范 的 使 用 来 源 ”， 用 于 选择 所 用 的 统计 图 模块 来 源 ， 较 少 使 用 。 
(7) “标题 ”对 话 框 中 应 填 入 统计 图 的 标题 和 脚注 (如 图 8-23 所 示 ) ， 但 是 若 在 
此 处 写 入 统计 图 的 标题 , 其 默认 的 标题 位 置 在 统计 图 的 正 上 方 ,不 符合 中 文 统计 图 的 习惯 ， 
因此 需 将 标题 移入 统计 图 的 下 方 ， 或 者 在 统计 图 制作 完成 后 在 统计 图 的 下 方 补 充 标 题 。 


图 8-23 ”标题 对 话 框 


(8) “选项 ”对 话 框 在 每 个 统计 图 的 对 话 杠 中 都 有 ， 用 以 定义 与 缺失 值 、 误 差 有 头 
的 内 容 ， 如 图 8-24 所 示 。 
(9) 单 击 “OK ”按钮 ， 即 可 获得 图 8-14 所 示 。 
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2. 复式 条 图 和 堆积 面积 图 

例 8.2: 以 例 8.1 数据 为 例 ， 欲 比较 不 同 专 业 中 不 同性 别 大 学 生 的 肺 呼 量 ， 请 绘制 合 
适 的 条 医 

单 击 “图 形 ” 一 “ 旧 对 话 杠 ”一 “条 形 图 ”命令 , 选 入 “复式 条 图 ”和 “个 案 组 摘要 ” 
后 ， 单 击 “ 定 义 ” 按 钮 ， 将 肺 呼 量 选 入 变量 框 ， 统 计量 默认 为 均 数 ， 横 坐标 仍然 为 年 级 

性 别 作 为 定义 聚 类 ， 如 图 8-24 所 示 ， 其 他 设置 与 单 式 条 图 相同 ， 单 击 “ 确 定 ” 按 钮 
后 ， 所 作 复 式 直 条 图 如 图 8-15 所 示 。 但 如 果 将 复式 直 条 图 的 两 种 或 多 种 分 类 在 同一 个 直 
条 中 展示 ， 即 为 堆积 面积 图 ， 单 击 “ 图 形 ” 一 “有 旧 对 话 框 ” 一 “条 形 图 ”命令 ， 选 入 “ 挫 
积 和 面积 图 ”和 “个 生 组 摘要 ”后 ， 蛙 击 “ 定 义 ”， 对 话 框 设置 如 图 8-26 所 示 ， 有 所 作 堆 积 
和 如 图 8-16 所 示 。 
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图 8-24 ”选项 对 话 框 图 8-25 ”复式 直 条 图 的 模块 设置 
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图 8-26 ”堆积 条 形 图 的 模块 设置 
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8.25 统计 图 编辑 


SPSS 所 生成 的 统计 图 都 是 按照 默认 选项 直接 产生 的 ， 而 现实 生活 中 人 们 第 会 按照 作 
目的 或 个 人 喜好 对 统计 图 进行 调整 和 编辑 。 

右 要 对 统计 图 进行 编辑 ， 融 必须 使 目标 图 形 进 入 编辑 状态 ， 选 中 目标 图 形 后 《以 
8-15 为 例 ) ， 单 击 “编辑 ”一 “编辑 内 容 ” 一 “在 单独 窗口 中 ”， 或 者 直接 双击 目标 
图 形 ， 即 可 进入 图 形 编 辑 窗 口 ， 如 图 8-27 所 示 。 图 标 编辑 亏 的 窗口 也 是 由 淫 单 项 、 工 其 
栏 和 状态 栏 组 成 ， 工 具 栏 和 来 里 项 是 一 一 对 应 的 ， 玉 早 项 包含 文件 、 编 各、 合 看 、 选 项 、 
元 系 和 儿 助 六 个 米 单 ， 其 中 对 于 图 形 编 辑 玉 训 主 要 使 用 的 古 编 务 、 选 项 和 元 系 三 个 玉 早 。 
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图 8-27 图 形 编 辑 窗口 


1.“ 编 辑 ” 菜 单项 

编辑 菜单 是 对 图 表 进 行 编辑 的 主要 菜单 项 ， 单 击 图 表 的 空白 区 域 ， 再 单 击 “编辑 ” 
菜单 项 后 ， 进 入 图 表 编 辑 菜 单项 ， 如 图 8-28 所 示 。 其 中 “属性 ”是 针对 图 表 进行 编辑 的 
主要 定义 模块 ， 而 “选择 蕊 轴 ” 和 “选择 了 轴 ” 则 可 对 蕊 轴 和 了 轴 进 行进 一 步 编辑 。“ 重 
新 调整 图 表 ” 可 针对 图 表 中 某 一 鼠标 选 定 区 域 进 行 展示 ， 而 “缩放 以 适合 数据 ”是 对 图 
表 大 小 进行 调整 以 适合 在 展示 框 中 进行 展示 。 

将 鼠标 移 至 图 表 中 的 空白 处 ， 单 击 “属性 ”， 进 入 属性 对 话 框 ， 如 图 8-29 所 示 。“ 图 
表 大 小 ”可 调整 图 表 的 高 度 和 宽度 ; “填充 和 边框 可 修改 空白 部 分 颜色 、 边 框 及 模式 ,“ 变 
量 ” 对 话 框 中 的 “元 素 类 型 则 可 将 目前 的 条 形 图 转化 为 内 插 线 图 、 路 径 图 、 标 记 图 和 饼 图 . 
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若 鼠标 单 击 图 表 中 的 直 条 , 则 意味 着 选中 所 有 直 条 ,此 时 , 单 击 “ 编 辑 ” 一 “属性 ”命令 ， 


如 图 8-30 所 示 。 其 中 ， “深度 和 角度 ” 可 炉 
类 别 轴 变 量 进行 合并 或 者 


者 二 和 [U1 Ctri+z 
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EAE 
节 崇 {E) 
后 置 性) 


图 8-28 ”编辑 菜单 项 

2.“ 选 项 ”菜单 项 
单 击 “ 选 项 ”菜单 项 ， 进 入 选 
轴 参 考 线 ” 是 在 图 表 中 给 


则 可 对 该 四 项 内 容 进行 补充 和 修改 ; “显示 网 格 线 ”可 对 卫 轴 和 了 轴 的 变量 分 类 绘 | 
“变换 图 表 ” 则 可 将 直 条 图 纵 同 和 
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图 8-30 ”属性 对 话 框 


步 定 义 ，“ 条 形 图 
为 100%， 则 类 似 于 直方 图 “变量 ”“ 图 表 大 小 ”和 “填充 和 边框 
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图 8-29 ”编辑 菜单 项 中 的 属性 对 话 框 


项 对 话 框 ， 如 图 8-31 所 示 。 其 中 “ 马 轴 参考 线 ” 和 “了 
出世 和 了 了 轴 的 取 值 参考 线 ; “标题 ”“ 注 释 ”“ 文 本 框 ” 和 “ 注 和 


训 刻 度 线 ; 
黄 同 进行 转换 。 


LX 轴 戎 考 线 

鼎 Y 轴 过 考 线 

| 过 来 自 方程 的 参考 线 (Q，) 
王 标题 
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加 文本 框 驯 ) 
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i 图 显示 洛 对 角 线 绽 制 的 图 表 (C) 
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名 隐藏 图 注 
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图 8-31 选项 对 话 框 
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3.“ 元 素 ” 菜 单 栏 

可 显示 每 一 个 直 条 的 数据 标签 及 绘制 内 插 线 。 

其 实在 图 表 编 辑 窗 口中 , 统计 图 可 视 为 由 各 个 基本 单位 构成 ,如 标题 、 坐 标 、 图 例 等 ， 
可 通过 单 击 鼠 标 左 键 选中 这 些 基本 单位 ， 然 后 再 双击 ， 即 可 弹出 相应 的 对 话 框 ， 从 而 完 


成 统计 图 的 编 转 


> 8.3 3-D 条 形 图 (3-D Bar ) 


3-D 条 形 图 是 复式 条 图 的 三 维 立 体 表现 形式 。 

例 8.3: 以 例 8.1 数据 为 例 ， 绘 制 不 同 专业 大 学 生 的 性 别 分 布 3-D 条 形 图 。 

(1) 单 击 “图 形 ” 一 “ 旧 对 话 框 ” 一 “3-D 条 形 图 ”， 弹 出 3-D 条 形 图 对 话 框 ， 如 
图 8-32 所 示 。 其 中 个 案 组 、 单 个 变量 和 个 别 个 案 的 定义 与 条 图 相同 。 


并 
” Catl Cat 
忆 纹 


模板 
加 | 要 上 古 用 的 图 表 指定 项 的 来 源 () : 


图 8-32 3-D 条 形 图 对 话 框 图 8-33 3-D 条 形 图 定义 对 话 框 


(2) 分 别 在 下 轴 代 表 含 义 和 Z 轴 代表 含义 选项 框 中 选择 “个 案 组 ”， 单 击 “ 定 义 ” 
按钮 ， 弹 出 3-D 条 形 图 定义 主 对 话 框 ， 如 图 8-33 所 示 。 

(3) 将 年 级 和 性 别 分 别 选 入 “天 类 别 轴 ”和 “Z 类 别 轴 ”， 其 了 轴 表 示 描 述 统计 量 ， 
即 为 “图 的 表征 ”， 本 例 选 择 默认 的 个 案 数 ; 面板 依据 中 的 行 与 列 的 设置 与 条 图 相同 ， 
堆积 /分 群 依据 中 的 “堆积 ”“ 工 中 的 分 群 ”“2Z 中 的 分 群 ”是 指 将 了 轴 、 式 轴 和 了 轴 指 
标 按 照 某 因 素 进 行进 一 步 的 分 类 展示 ; 标题 、 选 项 和 模板 的 定义 同 条 形 图 部 分 。 
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(4) 由 于 本 例 只 是 对 不 同 专业 大 学 生 的 性 别 分 布 做 3-D 条 形 图 ， 直 接 单 击 “ 确 定 ” 
按钮 ， 获 得 结果 ， 如 图 8-34 所 示 。 


图 8-34 不同 专业 大 学 生 的 性 别 分 布 


=> 8.4 线 图 (Line) 


线 图 是 用 线段 的 升降 表示 数值 的 变化 ， 描 述 某 统计 量 随 男 一 变量 变化 而 变化 的 趋势 
或 者 速度 ， 或 某 统计 量 随时 间 变 化 的 过 程 。 绘 制 线 图 的 要 求 是 两 变量 的 观察 值 必须 一 一 
对 应 , 如 果 一 个 变量 的 一 个 观察 值 对 应 男 一 个 变量 的 两 个 或 多 个 观察 值 , 就 不 能 绘制 线 图 ， 
可 绘制 散 点 图 。 有 时 会 将 两 个 或 多 个 意义 相同 的 线 图 放 在 同一 个 坐标 系 中 ， 以 利于 直观 
比较 它们 的 变化 趋势 。 

例 8.4: 以 例 8.1 数据 为 例 ， 绘 制 不 同 专业 、 不 同性 别 间 大 学 生 肺 呼 量 的 垂直 线 图 。 

因 简 单线 图 及 多 线 线 图 与 单 式 条 图 和 复式 条 图 的 制作 方法 几乎 完全 一 致 ， 这 里 不 再 
歼 述 ， 只 展示 垂直 线 图 的 制作 构成 。 

(1) 单 击 “ 图 形 ” 一 “ 旧 对 话 框 ”一 “ 线 图 ”命令 , 弹出 线 图 对 话 框 ， 如 图 8-35 所 示 。 
简单 线 图 对 应 于 单 式 条 图 ， 多 线 线 图 对 应 于 复式 条 图 ， 垂 直线 图 则 等 同 于 堆积 条 图 ， 所 
不 同 的 是 堆积 条 图 用 的 是 直 条 的 长 短 来 显示 数量 间 关 系 ， 垂 直线 图 使 用 线条 的 高 低 来 反 
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映 。“ 图 表 中 的 数据 为 ”选项 框 的 定义 同 8.2.4 小 节 部 分 完全 一 致 。 
(2) 选中 “重生 线 图 ” “个 守 组 摘要 ”后 ， 单 击 “ 定 义 ”， 人 得 到 竺 二 线 图 制作 主 对 
框 ， 如 图 8-30 所 示 。 将 肺 呼 量 、 专业 和 性 别 分 别 移 入 “看 量 ” “类 别 轴 入 # 定 业 点 和 = 


1 
单 击 “确定 ” 按 钮 ， 即 获得 不 同性 别 间 大 学 生 的 肺活量 情况 的 垂直 线 图 ， 如 图 8-37 所 示 。 
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专业 
图 8-37 ”不同 专业 、 不 同性 别 间 大 学 生 的 肺 呼 量 情况 


> 85 面积 图 (Area 


四 积 图 ， 叉 称 区 域 图 ， 是 用 面积 米 表现 式 
] 直 条 图 和 线 图 相似 。 


8.5.1 -从 里 面积 图 


例 8.5: 以 例 8.1 数据 为 例 ， 绘 制 不 同 专业 大 学 生 

(1) 单 击 “图 形 ” 一 “有 旧 对 话 框 ”一 “ 古 

所 示 。 面积 图 可 分 为 两 类 , 简单 面积 图 和 堆积 盏 

E 积 面积 图 和 囊 条 图 中 的 堆积 面积 图 】 
义 同 8.2.4 部 分 完全 

) 单 击 “ 人 简单 ” ”一 “定义 ”命令 ， 进 入 简单 面积 图 的 主 对 话 框 ， 

如 图 8-39 所 示 。 由 于 本 例 只 是 描述 不 习 专 业 大 学 生 的 频数 ， 因 而 面 


积 的 表征 处 直接 选择 
系统 默认 的 个 案 数 ， 将 专业 选 入 “类 别 轴 ”， 单 击 “ 确 定 ” 按 钮 ， 所 得 面积 
所 示 。 


妆 量 随 另 一 变量 变化 的 关系 ， 其 制作 步 


又 后 


肺 呼 量 频数 的 面积 图 。 
积 图 ”命令 ， 弹 出 线 图 对 话 框 ， 如 图 8-38 
积 图 , 徐 单 面积 图 的 图 形 等 同 于 傈 单线 图 ， 


和 4 


到 如 图 8-40 


区 域 表示 
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图 表 中 的 数据 困 


加 个 率 组 摘要 (G) 


Q 单独 变量 的 捕 要 人 柑 析 
回 单个 个 案 的 值 由 要 使 用 的 图 表 指定 项 来 章 山 ) : 


园 由 大 变量 :无 空 列 ) 山 


图 8.38 面积 图 对 话 杠 图 8-39 ”简单 面积 图 的 主 对 话 框 


统计 图 | 091 
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0 | 
Po 


专业 
图 8-40 不 同年 级 大 学 生 的 肺 呼 量 频 数 分 布 面积 图 


8.5.2 ”堆积 和 面积 图 


例 8.6: 以 例 8.1 数据 为 例 ， 绘 制 不 同 专 业 、 不 同性 别 间 大 学 生 的 肺 呼 量 的 堆积 面 
积 图 。 

单 击 “ 图形” 一 “ 旧 对 话 框 ”一 “面积 图 "命令, 选 入 “堆积 面积 图 ”一 “个 案 组 摘要 ”一 “ 定 
义 ” 命 令 ， 进 入 堆积 面积 图 的 主 对 话 框 ， 如 图 8-41 所 示 。 本 例 是 描述 不 同 专业 、 不 同性 
别 大 学 生 的 肺 呼 量 频 数 ， 因 而 面积 的 表征 处 直接 选择 系统 默认 的 个 案 数 ,将 专业 选 入 “类 
别 轴 ”， 将 性 列 选 入 “定义 面积 ”， 单 击 “ 确 定 ” 按 钮 ， 所 得 面积 图 如 图 8-42 所 示 。 
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| 全 膝 计 日 分 引 
平均 值 1 已 


r 
2 Zscorat 体 重 )[Z 丰 重 ] 


国 岂 变 支 量 “ 乱 空 行 ) (E) 
列 人 L) : 


团 崇 在 坟 是 :学 空 #1) 山 


图 8-41 堆积 面积 图 主 对 话 框 
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100000 


肺 呼 量 总 和 


| 
妇幼 护理 基础 口腔 临床 全 科 生 多 卫 管 心理 医 检 预防 
专业 


图 8-42 不 同 专业 、 不 同性 别 大 学 生 的 肺 呼 量 分 布 面积 图 


只 8.6 饼 图 (Pie) 


饼 图 是 用 来 表示 各 个 部 分 与 总 体 的 构成 关系 ， 它 以 整个 圆 的 面积 表示 总 体 ， 各 组 成 
部 分 的 大 小 对 应 其 所 占 的 构成 比 大 小 。 
例 8.7: 以 例 8.1 数据 为 例 ， 绘 制 不 同 专业 大 学生 频 数 的 饼 图 。 
(1) 单 击 “ 图 形 ” 一 “有 旧 对 话 框 ”一 “面积 图 ”命令 ， 进 入 饼 图 对 话 框 ， 如 图 8-43 
所 示 。 个 案 组 摘要 、 各 个 变量 的 摘要 、 个 案值 选项 框 的 定义 同 8.2.4 部 分 完全 一 致 ， 单 击 
“定义 ”， 进 入 饼 图 定义 对 话 框 ， 如 图 8-44 所 未 。 


从 区 去 不 
态 十 素数 同名 个 广 昌 分 (向 
总 变量 总 和 后 ) 


国民 一 


成, 血型 
地 Zscorgl 自 高 ) 区 身高 ] 
人 ZScofe( 体 重 ) 区 体重 ] 


国共 才 变 且 (元 空 行 ; (E) 
Ry: 


图 峡 到 变量 ' 元 下 #) 册 


模 栋 
局 雯 使 用 的 图 表 指 证 项 的 率 产 (UU) : 


图 8-43 ”人 饼 图 对 话 框 图 8-44 ”人 饼 图 定义 对 话 框 
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(2) 因为 是 对 各 专业 的 频数 进行 统计 ， 所 以 选择 默认 的 “分 区 的 表征 ”为 个 案 数 ， 
将 专业 选 入 “定义 分 区 ”， 单 击 “ 确 定 ”， 获 得 各 专业 人 数 的 饼 图 ， 如 图 8-45 所 示 。 


SI》 中 全 科 
图 8-45 “各 专业 频数 分 布 饼 图 


高 低 图 ( High-Low Charts ) 


高 低 图 是 用 多 个 垂直 线段 来 表示 数值 区 域 的 统计 图 ， 如 一 组 测定 值 的 范围 《最 小 值 - 


最 大 值 ) 、95% 置信 区 间 (下 限 - 上 限 ) 、x 十 1.96s【〈 低 值 - 均值 - 高 
市 场 长 期 及 短期 数据 波动 等 。 
例 8.8: 茶 研 究 者 检测 某 工 三 作 业 车 间 温 度 ， 连续 一 周 获 得 该 工厂 每 天 温度 的 最 
值 、 最 低 值 和 平均 值 ， 数 据 见 data8.1.sav， 请 绘制 高 低 图 。 
一 一 单 击 “图 2 “| 日 对 话 框 ” “ 盘 高 一 盘 低 a 条 命令 ， 
Wh [| Se ed 如 图 8-46 所 示 。 


Wm | Tb (1) 简单 高 低 收盘 图 : 用 线段 顶端 、 底 问 和 符号 来 表 
可 示 单位 时 间 内 菜 现象 的 最 高 数值 、 最 低 数值 和 最 后 数值 (也 
se | 可 以 是 其 他 统计 量 )， 

otra (2) 简单 范围 条 形 图 : 用 直 条 表示 单位 时 间 内 某 现 象 
9 有 0 | 的 最 局 数值 和 最 低 数 值 ， 但 不 显示 最 后 数值 。 


_ 国 男 男 ”|‖ (3) 旋 状 高 低 收盘 图 用 两 条 或 者 多 条 线段 的 顶端、 
图 8-46 “高低 图 对 话 杠 。 ” 底 端 和 符号 来 表示 单位 时 间 内 两 个 或 两 个 以 上 现象 的 最 
值 、 最 低 数值 和 最 后 数值 

4) 全 人 东 轩 条 开 图 用 两 个 或 者 多 个 直 条 的 顶端 、 底 端 来 表示 单位 时 间 内 两 个 或 
两 个 以 上 现象 的 最 高 数值 、 最 低 数值 。 

.5) 差别 面积 图 它 是 说 明 两 个 现象 在 同一 时 间 内 相互 变化 对 比 关系 的 线性 统 计 图 

个 案 组 摘要 、 各 个 变量 的 摘要 、 个 案值 选项 框 的 定义 同 8.2.4 部 分 完全 一 至 
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本 例 是 对 单位 时 间 内 菏 单 一 指标 的 最 高 值 、 最 低 值 和 平均 值 随时 间 的 变化 规律 ， 应 
绘制 简单 高 低 收盘 图 。 

单 击 “ 徐 单 高 低 收 盘 ” 一 “各 个 变量 的 摘要 ”一 “定义 ” 傅 令 ， 进 入 简单 局 低 收盘 
图 主 对 话 框 ， 如 图 8-47 所 示 。 

在 “ 融 ”“ 低 ”“ 团 合 ” 和 “类别 轴 ” 选 项 框 中 依次 选 入 “了 最 局 什 ”“ 最 低 伍 ”“ 平 
均值 ”和 “星期 ”， 其 他 选项 框 的 说 明 同 前 和 面 一 致 。 单 击 “ 确 定 ”， 获 得 一 周 温度 高 低 图 ， 
如 图 8-48 所 示 。 

在 数 据 库 未 按照 每 日 的 最 高 什 、 了 最 低 值 和平 均值 进行 汇总 ， 只 是 给 出 每 日 中 每 次 讽 
量 的 具体 数 伍 ， 如 数据 data8.2.sav， 则 可 以 通过 “数据 ”一 “分 关 汇 总” 对话 框 产生 按 
天 进行 汇总 的 每 日 最 高 值 、 最 低 值 和 平均 值 , 将 星期 选 入 “分 组 变量 ”, 将 PM25 选 入 “ 变 
量 摘要 ” 框 ， 单 击 “ 图 数 ”， 分 别 选 择 最 大 值 、 最 小 值 、 均 什 ， 并 在 “全 人 存 ” 柱 中 选择 “与 
入 只 包 作 汇总 变量 的 新 数据 文件 ”, 并 创建 新 文件 , 如 图 8-49 所 示 , 所 创建 新 文件 如 图 8-50 
所 示 ，data8.3.sav。 


申 定义 简单 盘 高 - 盘 改 -收盘 图 ; 单独 变量 的 摘要 


地 最 高 值 high] ee 
人 本 (OO)-， 
她 平均 值 [meanl 一 、 低 QL): 
| 六 MEAN( 最 低 值 [lowl) : 
Ee 40.00 平均 值 
工 最 高 值 
ee 。 平均 值 
30.00 
国 嵌 喜 变量 【无 空 行 ) {E) 25 00 
slrM) : 
20.00 
图 岩 套 变量 【无 空 列 ) 山 
惨 板 
要 使 用 的 图 表 指定 项 的 来 产 仙 ) : 1 00 


[文件 (E)_ | 


日 期 
图 8-47 简单 高 低 收 盘 图 主 对 话 框 图 8-48 一 周 气 温 高 低 
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FMza5_ rmean 三 网 EANIPM25) 
PMa5_max = MAXIPMa2S) 


保存 
加 将 汇总 变量 添加 到 活动 数据 集 加 ) 
晤 创建 只 包含 汇总 变量 的 新 数据 集 人 E) 


有 本 |2PM25 mean | PH25 ma “mia5 | 变量 
z 数据 焦 韦 种 (C) : = gq5. BO 47. O00 二 


103. 680 57.50 
92. 08 56. 84 
87. 16 47. 00 
98. 44 57. 50 


用 于 大 型 数据 集 的 进项 | .97 三 
交 件 已 按 分 界 变 量 进 行 排序 内 93. 12 67. 30 
汇总 前 对 文件 进行 排序 (G) | 7 76.16 -102.00 56. 25 


[ieM SPSS Siesika 儿 理 得 所 了 增 | | |Unien 


图 8-49 ”数据 库 分 类 汇总 图 8-50 ”分 类 汇总 所 产生 的 数据 库 


> 8.8 和 图 ( Boxplot |) 


箱 图 可 直观 描述 连续 型 变量 的 分 布 及 离散 状态 ， 箱 图 可 显示 数据 的 5 个 特征 值 ， 分 
由 、 下 四 分 位 数 (P,;) 、 中 位 数 (CP:) 、 上 四 分 位 数 (P,) 和 最 大 值 。P,; 和 
站 图 的 “ 箱 体 ”部 分 ， 去 除开 第 值 以 外 的 最 小 仁和 P,;s、 去 除 异 常 值 以 外 的 最 大 
值 和 Pj; 之 间 分 别 构成 “箱子 ”的 上 下 两 条 端 线 ， 异 常 值 指 的 是 大 于 和 
的 数值 ， 在 箱 图 中 用 小 圆圈 “OO” 表 示 ， 大 于 3 倍 四 分 位 数 间距 的 数值 称 为 极端 值 ，1 
和 中 用 星 写 “* ”表示 。 
例 8.9: 以 例 8.1 数据 为 例 ， 绘 制 不 同 专业 大 学 生 的 肺 呼 量 的 箱 图 。 
(1) 单 击 “ 图 形 ” 一 “ 旧 对 话 框 ” 一 “ 箱 图 ”命令 ,进入 箱 图 对 话 框 ， 如 图 8-51 所 示 。 
图 和 复式 箱 图 的 区 别 等 同 于 简单 条 图 和 复式 条 图 的 关系 ; 个 案 组 摘要 和 各 个 
变量 的 摘要 选项 框 的 定义 司 8.2.4 部 分 完全 一 致 。 
(2) 选择 “简单 ”一 “个 案 组 摘要 ”选择 项 ， 单 击 “ 定 义 ”， 进 入 简单 箱 图 对 话 框 ， 
如 图 8-52 所 示 。 
(3) 将 肺 呼 量 和 专业 分 别 选 入 “变量 ”和 “类 别 轴 ”， 单 击 “ 确 定 ”， 生 成 不 同 专 
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业 大 学 生 肺 呼 量 


六 Zscore{ 身 高) 区 身 高 ] 

Zscore( 体 重 ) 区 体重 ] 
国府 套 变量 i 无 空 行 ) (My) 
Fl): 


转 嵌 套 变量 【无 空 列 ) 山 


图 8-52 ”简单 箱 图 主 对 话 框 


妇幼 护理 基础 口腔 临床 全 科 0 卫 管 心理 医 检 预防 


专业 
图 8-53 ”不同 专业 大 学 生 肺 呼 量 的 箱 图 


> 8.9 误差 条 图 ( Error bar ) 


误差 条 图 可 用 来 显示 数据 所 来 自 的 总 体 的 离散 程度 ， 使 用 均 数 和 可 : 


标准 差 、 均 数 和 标 ; 


言 区 间 、 均 数 和 
误 描 述 数值 变量 。 


' 
全 1 
Fr 
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例 8.10: 以 例 8.1 数据 为 例 ，1) 用 单 式 误差 条 图 比较 不 同 专业 大 学 生 的 肺 呼 量 ，2) 用 
复式 误差 条 图 比较 不 同 专业 、 不 同性 别 大 学 生 的 肺 呼 量 。 有 具体 步骤 如 下 : 

(1) 单 击 “ 图 形 ” 一 “ 旧 对 话 框 ” 一 “误差 条 图 ”， 进 入 误差 条 图 对 话 框 ， 见 图 8-54。 
其 中 ， 简 单 及 复式 条 图 的 差异 等 同 于 单 式 条 图 和 复式 条 图 ， 个 案 组 摘要 及 各 个 变量 的 摘 
要 意义 同 本 章 8.2.4 部 分 。 

(2) 选择 “简单 ”和 “个 案 组 摘要 ”， 单 击 “ 定 义 ”， 进 入 简单 误差 条 图 的 定义 对 
话 框 ， 见 图 8-55。 


尖 别 辆 (GC) : 委 项 但) 
= 
| [ 系 形 夫 示 扣 ) 
| 平均 人 情 的 置 售 区间 
染 BIE): 85 |% 未 人 iW): 2 


i 
国 忆 


| | nn 


图 表 中 的 数据 亲 


加 个 案 组 摘要 人 G) 
单独 变量 的 摘要 (由 


图 岩 套 变量 【无 空 列 ) 由 


模板 
加 要 使 用 的 图 表 推 定 项 的 来 源 () : 
节 忻 {EY.. 


图 8-54 ”误差 条 图 对 话 框 图 8-55 ”简单 误差 条 图 的 定义 对 话 框 
(3) 将 肺 呼 量 和 专业 先入“ 变量” 和“ 类别 轴 ”; 在 “条 的 表征 ”下 拉 菜 单 中 ， 有 


可 分 别 展示 均 数 的 95% 置信 区 间 、 均 数 的 2 倍 标准 误 和 2 倍 的 标准 差 。 本 例 选 择 默 认 的 
均 数 的 95% 置信 区 间 ; 面板 依据 、 标 题 、 选 项 及 模板 意义 同 条 图 部 分 的 定义 一 致 。 

(4) 单 击 “ 确 定 ” 按 钮 ， 产 生 不 同 专业 大 学 生 肺 呼 量 的 误差 条 图 ， 如 图 8-56 所 示 。 

(5) 在 上 述 第 二 步 中 选择 “复式 条 图 ”和 “个 案 组 摘要 ”， 进 入 复式 误差 条 图 的 定 
义 对 话 框 ， 如 图 8-57 所 示 。 

(6) 将 客观 文 持 分 、 年 级 和 性 别 分 别 选 入 “变量 ”“ 类 别 轴 ” 和 “定义 聚 类 ”中 ， 
单 击 “ 确 定 ”， 即 可 产生 不 同 专业 、 不 同性 别 大 学 生 肺 呼 量 的 误差 条 图 ， 如 图 8-58 所 示 。 
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本 toral 苯 下] 区 笨重] 


好 的 护理 基础 口腔 临 末 全 科 生 物 卫 管 心理 医 丛 预 访 。 | Er 


图 8-56 不 同 专业 大 学 生 肺 呼 量 的 误差 条 图 


妇幼 护理 基础 口腔 临床 全 科 生 物 卫 管 心理 医 检 预 防 


个 
图 8-58 不 同 专业 、 不 同性 列 大 学 生 肺 呼 量 的 误差 条 图 


字 8.10 ”人 口 金字 塔 图 ( Population Pyramid ) 

人 口 金字 塔 图 是 SPSS 13.0 以 后 版 分 类 描述 基 变 量 的 

例 8.11: 以 例 8.1 数据 为 例 ， 采 用 人 口 金 字 塔 图 描述 不 同性 别 大 学 生 肺 呼 量 的 频数 
分 布 。 


本 才 有 的 一 种 图 形 ， 它 是 根 
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命令 ， 进 入 人 口 金字 塔 图 对 


(2) 将 肺 呼 量 和 性 别 分 别 选 入 “显示 分 布 ” 和 “分 割 依据 ”， 
单 击 “ 确 定 ”按钮 ， 即 可 产生 不 同性 别 大 学 生 肺 呼 量 


其 他 对 话 框 定义 如 前 。 
的 人 口 金字 葵 岁 ,如 图 8-60 


困 性 列 ee 


蝇 EM 抠 计 窒 计 娄 ( 忆 ) 
总 尼 谈 量 中 获 中 计 获 从) 


回 要 上 用 的 图 夫 指 让 项 引 让 源 () ; 
ETT 
8s0 60 40 20 0 20 40 60 80 
频率 


图 8-59 人 口 金字 塔 图 主 对 话 框 图 8-60 不 同性 别 大 学 生 肺 呼 量 的 人 口 金字 塔 图 


散 点 图 ( Scatter ) 


散 点 图 是 用 于 表示 两 个 或 多 个 变量 之 间 有 无 相关 关系 的 统计 图 。 单 
对 话 框 ” 一 “ 散 点 图 ”命令 ， 进 入 散 点 图 对 话 框 ， 如 图 8-61 所 示 。 

(1) 简单 分 布 散 点 图 : 适用 于 两 个 变量 之 间 的 关系 描绘 ， 每 个 点 代表 
的 两 个 变量 值 ; 
矩阵 分 布 散 点 图 : 采用 和 矩阵 形式 表达 多 个 变量 之 间 两 两 天 系 的 散 点 图 ; 
(3) 简单 扩 图 采用 点 纵 回 累加 的 形式 摘 述 某 单一 变量 的 频数 分 布 ， 


生生 图 形 3 上 日 


C5) 3 D 分 布 散 点 图 ， 用 于 描述 
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8.11.1 人 简单 分 布 散 点 图 


例 8.12: 以 例 8.1 数据 为 例 ， 描 述 大 学 生 身高 与 
体重 的 天 系 。 上 | 简单 表 点 图 上 1% 矩阵 散 点 图 简单 点 
(1) 在 图 8-61 的 基础 上 选择 “简单 部 分 ”， 单 Pap 
击 “ 定 义 ”， 进 入 简单 分 布 散 点 图 对 话 框 ， 如 图 8-62 ed 
所 示 。 分 别 将 身高 和 体重 纳入 “了 轴 ” 和 “成 轴 ”。“ 设 EX) Be my, 
置 标记 ”选项 框 可 根据 某 外 部 变量 (如 性 别 ) 取 值 不 图 8-61 ， 散 点 图 对 话 杠 
同 将 每 个 点 标注 不 同 的 颜色 和 符号 , “标注 个 案 ” 可 针对 某 些 特殊 取 值 的 个 体 进行 标注 。 
其 他 选项 框 意义 如 前 所 述 。 
(2) 单 击 “ 确 定 ” 按 钮 ， 生 成 大 学 生 身 高 和 体重 的 简单 散 点 图 ， 如 图 8-63 所 示 。 


一 个 宰 标 注 依据 伦 ]1 1: 
| 1 
血型 面板 划 疮 依 汤 : 
扰 zacore 全 高) 区 身高 ] [WY : 
2 Zscorel[ 体 重 ) 区 体重 ] a 
四 


轩 央 套 将 县 【无 空 行 ) (NM) 
列 人 L) : 


ba 


圆 已 基 芝 其 【无 至 吕 ) fE) 
相配 
本 使 用 的 图 去 朱 定 项 的 引 ; 原 儿 由 ; 
| 计件 {E}.. | 


140.0 150.0 160.0 170.0 180.0 190.0 
身高 


图 8-62 ”简单 分 布 散 氮 图 对 话 杠 图 8-63 ”大 学 生 吴 局 和 体重 的 简单 散 点 图 


8.11.2 ” 算 阵 分 布 散 点 图 


例 8.13: 以 例 8.1 数据 为 例 ， 描 述 大 学 生年 龄 、 身 高 、 体 重 与 肺 呼 量 的 关系 。 

(1) 在 图 8-61 所 示 的 驮 础 上 选择 “ 窍 阵 分 布 ”， 单 击 “ 定 义 ”， 进 入 窍 阵 分 布 散 
凡 图 对 话 框 ,如 图 8-64 所 示 。 将 年 龄 、 喘 高 、 体 重 与 肺 呼 量 一 起 选 入 “ 定 阵 变量 ” 对话 框 ， 
其 他 选项 框 定义 如 前 。 

(2) 单 击 “确定 ”按钮 ， 生 成 年 龄 、 映 高 、 体 重 与 肺 呼 量 的 矩阵 散 点 图 ， 如 图 8-65 
所 示 。 
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各 证 


”标记 设置 依 据 (3): 


小 案 标 注 居 据 伦 ) : 
六 Zscore{ 自 高 ) 区 身高 ] | 
Zscore{ 体 重 )[Z 体 重 ] 


ar 


面板 划分 依据 : 
行 (W) : 


mn 


图 嵌 吉 变量 【无 空 行 ) (N) 
列 人 L) : 


旺 评 


转 谨 替 变量 【无 空 列 ) {E) 


模版 
要 使 用 的 图 表 指 定 项 的 来 源 (U): 


DIE 


和 体重 肺 呼 量 
图 8-65 ”大 学 生年 龄 、 身 局 、 体 草 与 肺 呼 量 矩 阵 黎 后 图 


图 8-64 ” 散 点 图 矩阵 设置 对 话 框 


8.11.3 简单 点 图 


例 8.14: 以 例 8.1 数据 为 例 ， 插 述 大 学生 肺 呼 量 的 频数 分 布 。 
(1) 在 图 8-61 所 示 的 葵 础 上 选择 “简单 点 图 ”， 单 击 “ 定 义 ”， 进 入 简单 点 图 对 话 框 ， 
如 图 8-66 所 示 。 将 肺 呼 量 选 入 “ 节 轴 变量” 对 话 框 ， 其 他 选项 框 定 义 如 前 。 
(2) 单 击 “ 硝 定 ” 按 钮 ， 产 生 大 学 生 肺 呼 量 的 简单 点 图 ， 如 图 8-67 所 示 。 


昌 定义 简单 点 图 


转 南 套 变量 (无 空 行 ) (MN) 
别人 L) : 


入 Zscorel 身 高 区 身高 间 下 站 
哆 zscore{ 体 重 ) 区 体重 ] 二 由 大 变量 【无 衬 虽 ) (EE) : a. : RN 
加 费 使 虱 的 图 表 指 十 项 的 来 头 仙 ) : 
| 记性 {E}.. | 和 
1000 5)000 3000 4000 
肺 呼 量 


到 8-67 大 学 生 肺 呼 量 的 简单 点 图 


图 8-66 ”简单 点 图 定义 对 话 杠 
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8.11.4 重 琶 分 布 散 点 图 


例 8.15: 以 例 8.1 数据 为 例 ， 摘 述 大 学 生年 龄 与 身高 和 体重 之 间 的 关系 。 
(1) 在 图 8-60 的 基础 上 上， 选择 “ 重 登 分 布 做 氮 图 ”， 单 击 “ 定 义 ”按钮 ， 进 入 于 
登 分 布 散 点 图 对 话 框 ， 如 图 8-68 所 示 。 将 “身高 ”和 和 “年龄”“ 体 重 ” 和 “年 龄 ”分 别 
先入 “了 YX 对 ”对 话 框 ， 其 他 对 话 框 定义 如 前 。 
(2) 单 击 “ 确 定 ” 按钮 , 产生 大 学生 年龄 与 身 局 和 体重 的 重 登 分 布 散 点 图 ， 如 图 8-69 
所 示 。 


| Sy | 
A 个案 标注 俯 所 [CG) : 


辐 委 巧 用 的 图 去 指定 项 的 直 源 山 ] 
充 忻 .. 


-ae 0.0 500 100.0 150.0 200.0 
图 8-68 重 硬 区 反 图 定义 对 话 框 图 8-69 ”大 学 生年 龄 与 喘 高 和 体 午 草 管 分 布 散 扣 图 


8.11.5 3-D 分 布 散 点 图 


例 8.16: 以 例 8.1 数据 为 例 ， 描 述 大 学 生年 龄 、 喘 高 和 体重 之 间 的 关系 。 
(1) 在 图 8-61 所 示 的 基础 上 上， 选择 “3-D 分 布 散 点 ”， 单 击 “ 定 义 ”， 进 入 3-D 
分 布 敌 扣 图 对 话 杠 ， 如 图 8-70 所 示 。 将 “里 品 ”"”“ 体 徊 ”和 “年 龄 ”分 列 选 入 “了 和 轴 ”“X 
轴 ” 和 “2Z 轴 ”对 话 框 ， 其 他 对 话 框 定义 如 前 。 
(2) 单 击 “确定 ”按钮 ,产生 大 学 生年 龄 、 喘 高 、 体 重 的 3-D 分 布 散 点 图 ， 如 图 8-71 
所 示 。 
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一 一 十 案 标注 依据 人 C): 
站 


面板 划 芝 依据 : 
和 0) : 
~ 
图 骨 震 变 旺 “无 空 行 ! 皮 ) 
FL): 
[>| 
转 册 套 变量 “无 空 列 ) {E) 
杭 板 


加 | 零 醒 用 的 图 去 指定 项 的 来 源 凡 用 : 
| 产 作 | IE) | 


140.0150.0 一 

-U160.0170 0 

i . 180 
身高 ; 


图 8-70 3-D 散 点 图 定义 对 话 框 图 8-71 ”大 学 生年 龄 、 映 高、 体重 的 3-D 分 布 散 扣 图 


字 8.12 有 直方 图 (Histogram ) 


直方 图 用 来 反映 茶 个 变量 的 分 布 情况 ， 是 一 种 钊 用 的 考察 变量 分 布 类 型 的 统计 图 ， 
直方 图 可 以 根据 频数 表 资 料 进行 绘制 ， 也 可 以 直接 根据 连续 性 变量 的 原始 数据 作 图 。 
例 8.17: 以 例 8.1 数据 为 例 ， 搬 述 大 学 生 肺 呼 量 的 频数 分 布 。 
(1) 早 击 “图 形 ” 一 “ 旧 对 话 框 ”一 “ 生 方 图 ” 命 仿 ,， 进入 卫 方 图 对 话 框 ， 如 图 8-72 
所 示 。 
(2) 将 主观 支持 分 先入“ 变量”， 并 勾 选 “显示 正 态 曲线 ”， 其 他 变量 定义 如 前 。 
(3) 单 击 “ 确 定 ” 按 钮 ， 产 生 大 学 生 肺 呼 量 的 直方 图 ， 如 图 8-73 所 示 。 
右 需 要 对 不 同性 别 大 学 生 分 别 绘制 肺 呼 量 的 直方 图 , 可 将 性 别 变量 选 入 “面板 依据 ” 
中 的 “ 行 ”或 者 “ 列 ”。 
统计 抽 图 的 学 习 ， 痛 先 根据 目 己 的 研究 目的 和 资料 的 类 型 ， 脑 海里 应 该 有 制作 何 
种 统计 图 的 概念 ， 然 后 选择 相应 的 图 形制 作 模 块 进行 制作 。 制 作 好 了 之 后 ， 如 来 不 付 
合 需 求 ， 则 需要 再 次 对 其 编辑 ，SPSS 中 只 要 双击 图 形 区 域 即 可 进行 二 次 编辑 。 虽 然 
SPSS 制作 常规 的 统计 图 功能 强大 ， 但 SPSS 制图 的 配色 一 直 为 人 们 所 诉 病 。 从 作 图 能 
力 上 来 说 ，SPSS 和 还 于 Graphpad、 有 R、Sigmaplot、Oringin、SAS， 但 第 规 作 图 发 表 是 
完全 其 备 的 。 
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平均 值 =3223.37 
标准 差 =894.497 


国 朵 大 变量 (元 空 行 ) (3) 


列 人 LI : 


图 迪夫 变量 i: 乱 空 7 (E) 


加 要 佑 用 的 图 表 指 定 项 的 来 源 (U) : 
Bala 


_A 


0 1000 2000 3000 4000 5000 6000 
= z z 肺 呼 量 
图 8-72 ”直方 图 定义 对 话 框 图 8-73” 大学生 肺 呼 量 直方 图 


没有 比较 就 没有 伤害 ， 没 有 比较 就 不 知 好 坏 。 
一 一 网 络 流行 语 


第 三 篇 初级 说 一 说 ， 采 用 统计 图 、 统 计 表 (统计 指标 ) 的 方式 ， 描 述 了 单 组 或 多 组 
数据 的 属性 特征 。 可 如 果 要 进行 组 间 属 性 特征 的 比较 ， 该 采用 何 种 方法 呢 ? 所 谓 “ 没 有 
比较 就 没有 伤害 ， 统 计 上 没有 比较 就 不 知 好 坏 ”，“ 是 骤 子 是 马 拉 出 来 多 交 ”， 所 以 第 
四 篇 我 们 就 来 聊 聊 “中 级 比 一 比 ”， 即 差异 性 研究 。 本 篇 分 别 益 述 统计 4 大 差异 性 研究 
方法 。 


1 检验 为 四 大 差异 性 统计 分 析 方 法 之 一 ， 是 基于 上 分 布 的 统计 理论 ， 处 理 两 个 总 体 间 
的 计量 资料 之 间 的 差异 。t 检验 包括 3 种 设计 类 型 ， 统 计 分 析 时 依据 统计 设计 类 型 与 资料 
是 否 符合 条 件 选择 相应 的 类 型 进行 统计 分 析 。 


这 9.1 基本 思想 与 类 型 


按照 中 心 极 限定 律 ， 计 量 资料 总 体 中 抽样 的 样本 均 数 分 布 符合 上 分 布 〈 见 图 9-1) ，t 
分 布 曲线 下 面积 为 1, 即 4HB+C=1,， 其 中 4HC=0.05, 而 PP 三 0.05 为 小 概率 事件 , 可 以 理解 为 ， 
如 果 在 一 个 计量 资料 的 总 体 中 抽取 一 个 样本 ， 样 本 均 数落 在 4 和 CC 中 的 可 能 性 为 小 概率 
事件 ， 而 小 概率 事件 在 一 次 抽样 过 程 中 不 可 能 发 生 ， 从 而 可 以 得 出 拒绝 F0 的 结论 。 


P>0.05, 
不 拒绝 0 ' 


拒绝 0 拒绝 H0 
择 受 HH 接受 1 


图 91 / 分 布 与 / 检验 原理 


如 某 研究 者 在 山区 随机 抽取 了 25 人 ,得 到 平均 脉搏 为 75.0 次 /分 ,标准 差 为 5.0 次 /分 ， 
而 经 过 大 量 调查 发 现 ， 一 般 健 康 男子 脉搏 为 72.0 次 / 分， 我 们 千 万 不 能 认为 75.0 次 /分 
>72.0 次 1/ 分， 就 认为 山区 组 男子 脉搏 均 数 高 于 一 般 健 康成 年 男子 72.0 次 /分 ， 因 为 一 般 
健康 成 年 男子 的 72.0 为 总 体 参 数 ， 而 山区 组 的 75.0 次 /分 仅 为 样本 统计 量 ， 两 者 不 在 同 
一 级 别 , 不 可 以 比较 。 正 如 某国 家 总 统 访 华 , 却 让 你 去 接见 一 样 , 不 合适 , 你 的 级 别 不 够 。 
而 且 样 本 统计 量 是 由 抽样 而 来 ， 抽 样 必然 会 发 生 抽 样 误差 

虽然 不 可 比 ， 但 我 们 可 以 通过 假设 检验 来 进行 比较 。 对 于 上 述 的 案例 ， 背 后 的 真理 
只 有 两 种 可 能 : 一 为 山区 组 健康 成 年 男子 与 一 般 健康 成 年 男子 脉搏 均 数 相 同 ; 二 为 两 者 
不 同 。 如 果 我 们 通过 小 概率 事件 的 原理 ， 证 明 其 中 的 一 种 可 能 不 可 能 发 生 ， 则 真理 就 在 
剩 下 的 那 种 假设 里 。 
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本 例 我 们 先 假设 山区 组 脉搏 均 数 等 于 一 般 健康 成 年 男子 脉搏 均 数 = (72.0 次/ 分) ， 
然后 看 能 否 在 这 个 总 体 中 抽 25 人 ， 其 均 数 为 75.0 次 /分 ， 标 准 差 为 5.0 次 /分 ， 如 果 得 
到 这 个 结果 的 可 能 性 落 入 A 或 者 C 区 域 ， 因 为 A、C 区 域 为 小 概率 事件 ， 则 认为 不 可 能 
发 生 ， 进 一 步 反 映 我 们 的 假设 两 者 总 体 均 数 相 等 不 成 立 ， 如 果 得 到 上 述 结果 的 可 能 落 入 
B 区 域 ，B 区 域 发 生 的 概率 P>0.05， 因 此 可 以 发 生 ， 故 我 们 就 没有 足够 的 理由 认为 两 者 
的 总 体 均 数 不 同 。 

虽然 都 是 1 检验 ， 但 根据 试验 设计 的 不 同 ， 依 然 可 以 分 为 三 类 ， 即 单 样本 1 检 验 、 两 
独立 样本 1 检验 和 配对 样本 检验， 随后 分 别 进行 讲解 。 


字 9.2 单 样 本 上 检验 


9.2.1 设计 思想 


单 样本 上 检验 的 设计 模式 图 如 下 ， 已 知 一 个 总 体 〈B) ， 现 在 在 一 个 未 知 的 总 体 〈4) 
中 随机 抽取 了 一 个 已 知 的 样本 《〈《C) ， 而 所 问 的 问题 是 总 体 44 与 总 体 召 之 间 有 无 差异 ? 
为 了 形象 记忆 ， 单 样本 上 检验 的 设计 模式 简称 为 “一 个 半 鸭 重 ”， 即 已 知 一 个 总 体 和 未 
知 总 体 中 的 一 个 样本 。 


已 知 妃 体 (8B) 


图 9-2 单 样本 + 检验 设计 模式 


9.2.2 ”案例 实战 


假定 大 学 生 的 平均 体重 为 SO0kg， 现 在 某 高 校 随机 抽取 590 名 大 学 生 并 测 其 体重 数据 ， 
问 该 校 大 学 生 的 体重 与 一 般 大 学 生 是 否 有 差异 ? (案例 数据 : data01.sav) 


9.2.3 ”案例 解析 
假定 大 学 生 的 平均 体重 为 SOkg， 这 是 一 个 已 知 给 予 的 总 体 参 数 。 现 在 某 高 校 随机 抽 
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取 了 590 名 大 学 生 并 测量 其 体重 数据 ， 这 590 名 大 学 生 的 体重 是 样本 统计 量 ， 而 该 高 校 
为 一 个 未 知 的 总 体 ， 符 合 我 们 上 面 讲 解 的 “一 个 半 鸭 蛋 ” 模 式 。 
9.2.4 实战 步骤 


1. 双击 打开 data01.sav 数据 
2. 调用 单 样本 1 检验 窗口 。 
操作 : 分 析 一 比较 均值 一 单 样本 1 检验 


库 。 


_ 人 所 直销 (MW) 。 图 形 (G) ”实用 程序 (U) 扩展 X) 窗 OV | 是 TT 和 本 汪 


报告 (E) 1 
村。 描述 统计 候 ) 
表 (B) h 
比较 平均 值 M) 
一 般 线性 模型 (6) 4 国学 # 林 T 检 验 (S) 
三 关 纺 性 模 二 (2) ” | 了 独立 样本 工 检验 
混合 模型 
四 | 捕 要 独立 样本 T 检 验 
二 局 避 成 对 样本 丁 检 验 (P).. 
对 数 线 性 (0) 国 单 E 末 ANOVA 检 验 .。 | 
图 9-3 调用 单 样 本 i 检验 步 又 图 9-4 单 样 本 /检验 功能 窗口 
3. 单 样 本 1 检验 窗口 属性 设置 。 


本 例 研究 的 结果 变量 或 者 效应 指标 为 体重 ， 因 此 把 体重 放 入 检验 变量 框 中 ;因为 已 
知 总 体 均 数 为 S0kg， 因 此 在 检验 值 框 中 输入 S0， 点 击 “ 确 定 ” 按 钮 即 可 ， 见 图 9-4。 


本 例 分 析 结 果 见 图 9-5。 单 样本 上 检验 结果 解读 为 两 步 法 。 

第 一 步 : 三 核心 

由 图 9-5(A) 拿 到 数据 的 三 个 核心 基本 统计 量 〈 样 本 量 、 样 本 均 数 和 标准 差 ) ， 产 
生 主 观 意 识 。 本 例 样 本 均 数 为 55.238kg， 我 们 感觉 ， 可 能 该 校 学 生 的 体重 要 高 于 一 般 大 
学 生 的 体重 ， 但 因为 存在 抽样 误 状 ， 不 能 下 主观 结论 ， 需 要 假设 检验 验证 。 

第 二 步 : 找 t 和 P 

由 图 9-5 (B) 可 见 ， 本 例 1 检验 的 六 14.936，P0.000<0.05， 因 此 ， 小 心 愤 〈 异 ) 辟 
( 异 ) ， 有 差异 ， 该 校 大 学 生体 重 的 总 体 均 数 与 一 般 大 学 生 的 平均 数 50.0kg 有 差异 ， 鉴 
于 55.238kg>50.0kg， 因 此 可 以 认为 该 校 大 学 生 的 体重 要 高 于 一 般 大 学 生 的 平均 体重 。 
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单 样本 检验 


检验 值 = 30 
F 一 一 一 一 一 村 mg 着 慎 95% 置信 区 间 
t e 自由 度 显著 性 ( 双 尾 平均 值 差 值 下 眼 上 限 


9-5 单 样本 1 检验 结果 


9.2.6 ”拓展 理解 

单 样本 1 检验 结果 解读 两 步 法 5 指标 ， 这 5 个 指标 在 发 表 文 章 中 都 是 必须 要 报道 的 ， 
结果 中 还 有 其 他 一 些 指标 帮助 理解 ， 一 般 无 须 报告 。 

应 用 条 件 : 样本 数据 符合 正 态 分 布 ， 不 符合 时 应 该 采用 非 参 数 检 验 ; 但 当 样 本 量 较 
大 时 数据 略 呈 偏 态 分 布 也 可 以 分 析 。 


> 9.3 两 独立 样本 丰 检验 


两 独立 样本 + 检验 的 思想 是 在 两 个 未 知 的 总 体 中 分 别 抽取 一 个 样本 ， 然 后 比较 两 个 
总 体 之 间 是 否 有 差异 ， 模 式 图 见 图 9-6， 形 象 比 喻 为 “两 个 半 个 的 鸭蛋 ”。 


图 9-6 两 独立 样本 1 检验 模式 
在 实际 研究 中 ， 两 个 样本 的 获取 只 有 两 种 可 能 : 一 是 随机 分 组 ， 如 60 只 SD 大 鼠 ， 
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随机 分 2 组 ， 每 组 30 只 ， 分别 接 受 不 同 的 处 理 ， 然 后 比较 某 个 计量 效应 指标 ; 二 是 按照 
某 种 属性 特征 分 组 ， 如 某 班级 按照 性 别 分 为 男生 组 和 女生 组 ， 然 后 比较 男女 生 某 门 课程 
的 考试 成 绩 差异 。 不 管 是 随机 分 组 还 是 按照 属性 特征 分 组 ， 均 是 保证 两 组 相互 独立 ， 不 
光影 啊 。 

9.3.2 ”案例 实战 

某 研究 者 在 某 高 校 随 机 抽取 了 590 名 大 学 生 ， 按 照 性 别 分 为 男生 组 和 女生 组 ， 现 想 
知道 男生 与 女生 的 肺 呼 量 CmL) 有 无 差异 。 (案例 数据 data01.sav) 

9.3.3 ”案例 解析 

受 试 对 象 分 为 两 组 ， 本 例 不 是 随机 分 组 ， 你 是 男生 就 必须 进入 男生 组 ， 女 生 就 必须 
进入 女生 组 ， 因 此 本 例 为 按照 某 种 属性 特征 分 组 。 男 生 和 女生 相互 独立 ， 效 应 指标 肺 呼 
量 (mL) 为 计量 资料 。 符 合 上 述 的 “两 个 半 个 的 鸭 重 ”设计 模式 图 。 

9.3.4 实战 步骤 


1. 调用 两 独立 样本 夫 验 功能 窗口 
操作 步骤 : 分 析 一 比较 均值 一 独立 样本 1 检验 ， 弹 出 图 9-7。 


| Sa 


0 | 性 别 |(1 2) 


图 9-7 独立 样本 1 检验 窗口 设置 


2. 独立 样本 奏 验 窗口 设置 

在 图 9-7 窗口 中 ， 将 效应 指标 “ 肺 呼 量 ” 放 入 检验 变量 框 中 ， 将 “性 别 ” 放 入 分 组 
变量 框 中 ， 点 击 “ 定 义 组 ”按钮 ， 设 置 1 和 2。 因 为 本 例 1 代表 男 ，2 代表 女 。 点 击 “ 确 
定 ” 得 到 结果 〈 见 图 9-8) 。 
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站 素数 平均 信 
脑 呼 景 “ 驳 303 3887.16 648.651 | 37.264 
Il 287 295222937 493839 29.150 


差 值 95% 置信 区 间 
下 限 上 限 


| 
t 目 由 度 ”至 者 性 【 双 必 平均 值 差 值 ”标准 误差 莽 信 


28.635 588 0000 | 1364.590 47.654 1270.997 -1458.184 
28.843 562.341 0000 1! 1364.590 47.311 1271.662 1457.519 


图 9-8 ”两 独立 样本 7 检验 结果 


9.3.5 结果 解读 


本 例 分 析 结 果 如 图 9-8 所 示 。 两 独立 样本 1 检验 的 结果 解读 为 三 步 法 。 

第 一 步 : 三 核心 

见 图 9-8(A) 部 分 ,与 单 样本 1 检验 一 样 , 首先 拿 到 两 组 数据 的 三 个 核心 基本 统计 量 ( 样 
本 量 、 均 数 和 标准 差 ) ， 产 生 主 观 意识 。 本 例 男生 肺 呼 量 均 数 3887.16mL， 女 生 肺 呼 量 
2522.57mL， 给 我 们 感觉 男生 的 肺 呼 量 要 高 于 女生 ， 但 因为 都 是 抽样 的 样本 ， 可 能 由 抽样 

第 二 步 : 方差 齐 性 (FF 和 P) 

大 家 知道 两 个 拳击 选手 进行 比赛 ， 要 求 两 个 选手 在 同一 个 重量 级 别 下 比赛 才 比 较 公 
平 。 同 样 两 个 抽样 均 数 之 间 比 较 ， 要 求 两 个 1 分 布 形态 相差 不 大 方才 可 以 。t 分 布 的 形态 
反映 的 是 其 离散 趋势 ， 方 差 也 是 反映 离散 趋势 的 指标 ， 统 计 上 采用 levene 方差 齐 性 检验 
进行 判定 两 个 分 布 是 否 相 同 。 

故 第 二 步 看 图 9-8 (B) 部 分 ， 得 到 levene 检验 F=22.559，P=0.000<0.05， 有 差异 ， 
因此 两 组 1 分 布 形态 分 布 有 差异 ， 不 在 一 个 重量 级 别 ， 不 适合 比较 。 

可 是 一 个 拳 馆 票 已 经 售 出 ， 晚 上 只 有 两 位 拳手 ， 而 两 位 拳手 又 不 在 一 个 重量 级 别 ， 
那 就 不 打 了 吗 ? 票 已 售 出 ， 非 打 不 可 ， 那 我 们 可 不 可 以 ， 进 行 相 关 规 则 的 调整 ， 让 重量 
级 别 轻 的 打 中 一 拳 算 两 拳 ， 级 别 重 的 打 中 一 拳 还 算 一 拳 进行 校正 ， 似 乎 也 可 以 进行 一 场 
精彩 的 比赛 。 因 此 当 两 独立 ! 检 验方 差 不 齐 的 时 候 , 我 们 也 可 以 进行 校正 的 两 独立 之 检 验 。 

第 三 步 : 1 检验 (1t 和 PP) 

见 图 9-8(C) 部 分 ， 此 部 分 有 两 行 ， 各 有 一 个 上 值 和 已 值 ， 如 何 选择 呢 ， 根 据 第 二 
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步 的 判定 。 本 例 第 二 步 发 现 两 组 方差 不 齐 ， 不 适合 直接 比较 ， 因 此 应 该 校正 。 
第 一 行 的 结果 为 方差 齐 的 结果 ， 太 28.63$，P0.000; 第 二 行为 方差 不 齐 进行 校正 的 
结果 ， 本 28.843，P=0.000， 本 例 应 该 看 第 二 行 的 结果 。 


两 独立 样本 1 检验 的 条 件 为 独立 性 、 正 态 性 和 方差 齐 性 (简称 : 独立 \ 正 态 、 方 差 齐 )。 
(1) 独立 是 指 两 组 数据 来 自 的 总 体 相 互 独 立 ， 比 如 本 例 的 男生 和 女生 的 总 体 是 相互 独立 
的 ， 独 立 性 的 判定 是 由 试验 设计 决定 的 ; (2) 正 态 性 是 指 两 组 数据 应 该 符合 正 态 分 布 ， 
正 态 与 否 是 由 研究 数据 决定 的 ， 但 这 条 要 求 不 是 非常 严格 ，L 检验 对 近似 正 态 或 轻微 偏 态 
分 布 也 比较 耐 受 ; (3) 方差 齐 性 要 求 非 党 严格， 方差 章 时 直接 用 ， 方 差 不 齐 要 校正 。 


> 94 配对 样本 1L 检 验 


配对 设计 + 检验 模式 图 见 图 9-9。 举 个 例子 更 容易 理解 某 医生 想 研究 一 种 降 压 药 是 
否 具有 降 压 作用 ， 选 了 5 名 高 血压 患者 (5 例 太 少 ， 仅 举例 哦 ) ， 检 测 了 血压 后 ， 采 用 
该 种 药物 进行 治疗 ， 治 疗 前 后 收缩 压 结果 见 图 9-9， 问 该 种 降 压 药 是 否 有 效 。 

这 是 一 种 典型 的 干预 前 后 配对 设计 ， 大 家 试想 一 下 ， 如 果 这 种 降 压 药 完全 无 效 ， 理 
论 上 治疗 前 与 治疗 后 的 差 值 应 该 为 0， 本 例 5 例 样本 的 差 值 是 不 是 类 似 这 种 降 压 药 治疗 
的 总 体 中 抽取 的 5 例 样本 ， 然 后 去 和 一 个 已 知 无 效 的 总 体 均 数 0 比较 。 大 家 看 图 9-9 (C) 
和 9.9 (D) ， 是 不 是 又 回 到 “一 个 半 鸭蛋 ”的 模式 图 啦 ! 是 的 ， 配 对 样本 1 检验 是 配对 
气相 减 变 成 一 组 数据 ， 然 后 去 和 已 知 总 体 0 比较 ， 其 实 就 是 转化 为 单 样本 1 检 


治疗 前 
1:160 
2:150 


3:1454 
4:143 
$5:138 


C D 
9-9 配对 样本 :检验 模式 
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配对 设计 还 包括 四 种 类 型 ， 见 图 9-10。 其 中 A 为 干预 前 后 配对 ， 如 同 组 病人 降 压 药 
治疗 前 后 ; B 为 同一 受 试 对 象 身体 不 同 部 位 配对 ， 如 测量 同一 个 人 左手 和 右手 的 血压 、 
检测 条 人 冶 组 织 与 瘤 芳 组 织 系 个 基因 表达 等 ;CC 为 条 件 配对 ， 如 在 一 视 老 鼠 中 ， 选 取 性 
别 和 体重 相同 的 2 只 作为 1 个 对 子 ， 继 续 寻 找 多 个 这 样 的 对 子 ， 然 后 每 个 对 子 中 的 2 个 
受 试 对 象 随 机 分 配 到 2 个 处 理 组 中 去 ; D 为 同一 份 标本 不 同 检测 方法 配对 , 如 同一 份 血液 ， 
分 成 2 份 ， 一 份 用 显微镜 法 检测 红细胞 含量 ， 一 份 用 仪器 法 检测 红细胞 含量 。 

凡是 上 述 4 种， 你 会 发 现 检测 的 两 组 数据 之 间 存 在 相关 性 而 不 独立 ， 这 与 两 独立 样 
本 设计 有 看 本 质 的 区 别 。 也 有 人 把 4 种 分 类 分 为 同体 配对 : A、B、D; 天 体 配 对 : C。 


配对 的 四 种 类 型 


9.4.2 ”案例 实战 
某 医 生 采 用 某 降 压 药 治 疗 10 例 高 血压 病人 ， 服 药 前 后 分 别 
| 1 | 130 | 114 | 


测量 受 试 者 的 舒张 压 为 检测 指标 ， 数 据 如 图 9-11 所 示 ， 问 该 降 : ra a 
压 药 是 否 具有 降 压 效果 ? (数据 文件 : data9.1.sav) | 
9.4.3 ”案例 解析 和 
i 116 日向 
受 试 对 象 为 10 名 高 血压 患者 ， 王 预 捕 施 为 某 种 降 压 药 ， | | OQ 

分 别 在 服用 降 压 药 前 与 服用 一 段 时 间 后 进行 舒张 压 的 测量 , 效 | 10 |， 124 ”106 | 


应 指标 为 舒张 压 ， 为 计量 资料 。 试 验 设 计 符 合 干预 前 后 的 配对 图 9-11 本 例 数据 库 
设计 。 
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9.4.4 实战 步 又 


1. 调用 配对 样本 考验 窗口 
步骤 : 分 析 一 比较 均值 一 配对 样本 1 检 验 ， 操 作 如 图 9-12， 弹 出 图 9-13。 


分 析 (A) ”直销 (MM) 。 图 形 (G) ”实用 程序 U) ”扩展 X) ”窗口 Q 


报告 @) | 国 国 归心 a WE 
描述 统计 (E) ;| a 2 四 多 
表 昌 | | E22 2 | 
比较 平均 值 (M) P| 国平 均值 M). 
一 加 乓 性 杭 下 人) ” | 国 单 样本 T 检 验 (3) 
的 ” | 辆 独立 样本 工 检验 ， 
混合 模型 
a ， | 加 jz 本 T4 验 | 
0 ， | 鸯 成 样本 T 检 给 忆 。 | 
~ | ] Fr | pas i J 
对 数 线 性 (OQ) 》 | 国 单 四 过 ANOVA 检 办 - | 
图 9-12 调用 配对 1 检验 图 9-13 成 对 样本 1 检验 属性 设置 


2. 配对 堆 验 窗口 设置 
在 图 9-13 中 ， 将 变量 “治疗 前 ”和 “治疗 后 ”先后 放 入 右边 的 配对 框 ， 配 成 1 对 ， 
然后 点 击 “ 确 定 ” 即 可 输出 计算 结果 〈 见 图 9-14) 。 
T- 检 验 


A 有 配对 样本 统计 


E 平均 值 个 案 数 标 . 佳 攻 ”和 标准 误 关 平 均值 
配对 14 治疗 前 。 126.20 10 7.084 4 2240 

治疗 后 110.20 10 9307 § 2943 

和 


配对 样本 相关 性 | 


个 案 数 。 1 相关 性 显著 性 : 


配对 1 治疗 前 & 治疗 后 10 1 0.963 0.000 
,PE 
配对 样本 检验 
配对 苦 值 Il [0 
” 差 值 95% 置信 区 间 和 
平均 值 。 ”标准 差 ”标准 误差 平均 值 F 限 F 限 tt 自由 度 ”显著 性 ( 双 尾 ) 】 
配对 1 治疗 前 - 治疗 请 16.000 3.127 0.989 13.763 18.237 p16.181 | 0.000 I 


9-14 ”配对 样本 1 检验 结果 


9.4.5 结果 解读 


配对 样本 上 检验 结果 解读 也 为 三 步 法 。 
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第 一 步 : 三 核心 

由 图 9-14 (A) 部分， 获取 治疗 前 后 的 样本 量 、 均 数 和 标准 差 。 本 例 发 现 治疗 前 舒 
张 压 为 126.2mmHg， 治 疗 后 为 110.20mmHg， 主 观感 受 为 该 药 可 能 有 降 压 效果 ， 但 有 待 
假设 检验 进行 验证 。 

第 二 步 : 看 相关 

大 多 数 情况 下 , 本 步 可 以 忽略 ， 因 此 国内 外 很 多 发 表 的 论文 并 没有 交代 本 步 的 结果 。 
但 从 统计 的 角度 ， 本 步 相 关 的 计算 是 为 了 验证 配对 数据 的 一 致 性 (consistent) ， 意 思 是 
治疗 前 较 低 的 个 体 ， 治 疗 后 的 值 也 处 于 较 低 的 地 位 ， 治 疗 前 较 高 的 个 体 ， 治 疗 后 也 处 于 
较 高 的 位 置 ， 用 以 说 明 干 预 措 施 作用 的 稳定 性 或 一 致 性 (Perry.R Hinton) 。 

可 能 存在 四 种 情况 : 

(1) 相关 与 1 检验 均 P<0.05， 说 明 数 据 一 致 性 好 ， 差 异 有 统计 学 意义 ， 而 且 差 异 的 
产生 就 是 干预 因素 作用 的 结果 ; 

(2) 相关 不 显著 , 1 检验 显著 ,上 暗示 均 数 存在 差异 ,但 个 体 间 均 数 差 异 变化 不 一 致 ， 
均 数 的 差异 可 能 还 受 其 他 因素 的 影响 ; 

(3) 相关 显著 ， 但 上 检验 不 显著 ， 说 明 数 据 有 一 致 性 ， 但 均 数 差异 不 显著 ， 即 干预 
措施 未 上 发挥 作用 : 

(4) 相关 与 上 检验 均 不 显著 ， 这 点 不 容易 解释 ， 但 受 试 者 数据 在 两 组 不 具备 一 致 性 ， 
组 间 均 数 差异 没有 意义 。 这 种 情况 ， 没 喻 担心 必要 。 

本 例 配 对 1 检验 的 庄 16.181，P=0.000<0.05， 因 此 有 差异 ， 认 为 治疗 前 后 患者 舒张 压 
的 差异 具有 统计 学 意义 ， 故 可 以 认为 该 降 压 药 具有 降 压 效果 。 


9.4.6 ”拓展 理解 
表 9-1 为 一 组 试验 数据 ， 请 问 应 该 如 何 进行 分 析 呢 ? 


表 9-1 治疗 前 后 中 医 证 候 积 分 的 变化 


a, 1 = 
iB 17 刚 | 


16.63 填 2.87 
17.00 士 2.60 
注 : ** 与 针 焦 组 比较 ，P<0.01， 人 人 与 治疗 前 比较 P<0.01 


这 是 较为 常见 的 带 基线 数据 组 间 比 较 ， 根 据 研究 目的 的 不 同 ， 可 以 采用 不 同 的 统计 
分 析 方法 。 
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1) 如果 想 知道 针 推 组 或 针灸 组 治疗 前 后 是 否 有 效 ， 那 么 属于 配对 设计 ， 应 该 采用 

(2) 如 果 想 知道 针 推 组 和 针灸 组 疗效 是 否 有 差别 ,可 以 先 计算 两 组 治疗 前 后 的 差 值 ， 
然后 采用 两 独立 样本 1 检验 进行 两 组 疗效 比较 ;还 可 以 采用 协 方差 分 析 ， 将 治疗 前 积分 
当 作 协 变 量 进行 方差 分 析 。 有 人 直接 对 治疗 前 进行 两 独立 1 检验 , 发 现 差异 无 统计 学 意义 ， 
则 直接 对 两 组 治疗 后 积分 进行 两 独立 上 检验 ， 这 种 做 法 已 不 再 提倡 。 


字 9.5 检验 小 结 


不 管 单 样本 1 检验 、 配 对 样本 1 检验 还 是 两 独立 样本 1 检验 ， 都 是 用 于 检验 两 个 总 体 
间 计 量 资 料 的 比较 方法 。 单 样本 1 检验 要 求 符 合 正 态 分 布 ， 两 独立 样本 1 检验 要 求 独 立 、 
正 态 和 方差 齐 ， 配 对 1 检验 要 求 差 值 符合 正 态 分 布 。 上 述 三 条 对 正 态 分 布 的 要 求 不 是 非 
党 严格 ， 近 似 正 态 分 布依 然 可 以 分 析 ， 也 可 以 采用 非 参 数 检 验 的 方法 进行 分 析 。 

t 检 验 的 常见 错误 是 ， 成 组 设计 的 多 组 计量 资料 之 间 比 较 ， 直 接 采 用 两 两 拆 分 后 ， 采 
用 t 检 验 进 行 分 析 ， 这 极 大 地 增加 了 I 类 误差 发 生 的 概率 。 如 3 组 资料 ， 两 两 比较 需要 进 
行 3 次 ， 每 次 进行 一 次 假设 检验 即 可 能 发 生 a=0.05 的 I 类 错误 ，3 次 则 会 发 生 0.15 (其 
实 是 近似 0.1$S， 松 哥 这 么 说 是 方便 大 家 记 住 ) ， 远 远 超 出 我 们 0.05 的 预期 ， 而 我 们 进行 
统计 分 析 时 ， 一 个 科学 研究 问题 I 类 误差 的 发 生 概 率 基 本 控制 在 0.05， 因 此 直接 拆 分 是 
不 可 菲 的 。 


1 检验 所 处 理 的 都 是 两 个 总 体 之 间 的 计量 变量 的 比较 。 你 可 能 说 不 对 呀 ， 两 独立 样本 1 检 
验 是 两 个 总 体 比 ， 单 样本 ! 检 验 和 配对 样本 上 检验 不 就 只 有 一 个 总 体 吗 ? 大 家 还 记得 单 样本 ; 
检验 的 模式 图 “一 个 半 鸭 蛋 ” 吗 ? 还 不 是 两 个 总 体 之 间 的 比较 吗 ? 配对 样本 上 检验 是 利用 
差 值 转换 为 单 样本 上 检验 做 的 ， 还 是 两 个 总 体 之 间 比 较 。 

可 是 当 我 们 处 理 多 个 总 体 之 间 的 比较 的 时 候 ， 如 图 
10-1, i 检验 就 已 经 无 能 为 力 了 。 对 于 图 10-1， 很 多 人 提出 
这 样 的 分 析 方 案 ， 说 三 个 总 体 之 间 比 较 ， 可 以 转化 为 AB、 
BC 和 AC 三 次 1 检验 不 就 可 以 了 吗 ? 确实 ， 以 前 还 真有 不 
少 人 有 这 种 想法 ， 但 这 是 错误 的 。 

大 家 知道 ， 我 们 进行 假设 检验 会 犯 1 类 和 II 类 统计 学 错误 ，I 类 错误 就 是 a， 就 是 我 
们 事先 确定 的 检验 水 准 ， 通 常 取 值 0.05， 图 10-1 本 来 就 是 一 个 科学 问题 ， 问 三 个 总 体 之 
间 有 无 差异 ， 而 你 却 采 用 了 3 次 1 检验 ， 每 一 次 都 会 犯 0.05 的 I 类 错误 ， 导 致 最 终结 果 
的 I 类 错误 发 生 率 远 远 高 于 0.05 这 个 我 们 能 够 接受 的 水 平 ， 导 致 推断 错误 概率 过 大 。 

那 怎 么 办 呢 ?” 于 是 R.A Fisher 就 发 明了 一 种 处 理 玉 个 总 体 间 计量 变量 比较 方法 一 一 
方差 分 析 。 方 差分 析 是 用 变异 的 思想 ， 将 总 的 变异 分 为 组 间 变 异 和 组 内 变异 ， 组 内 变异 
往往 是 个 体 变 异 导 致 ， 一 般 不 会 太 大 ; 而 组 间 变 异 除了 个 体 变 异 外 ， 还 有 组 间 干 预 措施 
导致 的 变异 , 因此 , R.A. Fisher 认为 , 如 果 组 间 的 变异 除 以 组 内 的 变异 , 结果 远 远 的 大 于 1， 
就 有 理由 认为 ， 组 间 的 干预 措施 在 发 挥 着 作用 ， 为 了 纪念 Fisher， 这 种 方法 简称 上 检验。 

同时 根据 不 同 的 分 组 方法 ， 或 者 说 是 干预 措施 的 添加 方法 不 同 ， 方 差分 析 有 着 不 同 
的 类 型 ， 下 面 就 逐一 开始 介绍 。 


10-1 多 组 比较 模式 图 


> 10.1 单 因素 设计 方差 分 析 


单 因素 设计 方差 分 析 是 研究 一 个 研究 因素 不 同 水 平 (K 宇 3) 间 的 计量 变量 比较 。 
受 试 对 象 分 到 天 组 中 去 ， 有 两 种 分 组 方式 : 随机 分 组 和 按照 条 种 属性 特征 分 组 。 如 一 组 
受 试 大 女 ， 按 照 随 机 化 分 组 的 方式 分 到 3 组 中 去 ， 每 组 20 只 ; 再 如 某 班 级 按照 血型 分 为 
四 组 ， 研 究 学 生 的 学 习 成 绩 。 前 者 就 是 随机 分 组 ， 后 者 就 是 按 属性 特征 分 组 ， 大 家 以 后 
进行 判定 一 定 要 找 随机 与 属性 这 两 个 关键 点 。 如 果 大 家 还 记得 前 面 的 内 容 ， 单 因素 设计 
下 检验 其 实 就 是 我 们 前 面 说 的 成 组 设计 天 组 的 情况 。 
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图 10-2 ” 单 因 素 设 计 方才 分 析 横 式 


案例 实 成 

菏 学 校 教务 处 ， 欲 研究 传统 教学 、PBL 教学 和 翻转 课 符 的 教学 效果 是 否 有 差异 ， 选 
择 了 某 班级 95 名 同学 ， 按 照 学 号 随机 分 成 3 组， 分 别 接受 三 种 教学 方法 进行 统计 学 课程 
教学 ， 期 末 采 用 同样 的 试卷 进行 了 考试 ， 获 得 学 生成 绩 数 据 〈data10.1.sav) ， 请 采用 合 
适 的 方法 进行 统计 分 析 ， 并 进行 解释 。 


案例 解析 
(1) 受 试 对 象 (95 名 学 生 ) 随机 分 组 ， 分 别 接受 三 种 教学 方法 ， 试 验 设计 为 成 组 
设计 下 组 。 


(2) 研究 因素 为 教学 方法 ， 有 三 个 水 平 ， 传 统 教学 、PBL 和 翻转 课堂 。 

(3) 试验 效应 指标 ， 即 本 次 研究 的 指标 学 生成 绩 为 计量 资料 。 

(4) 综 上 所 述 ， 优 先 考虑 单 因 素 设 计 方差 分 析 。 

(5) 方 差分 析 的 条 件 为 独立 、\ 正 态 和 方差 齐 。 本 组 组 间 为 随机 分 组 接受 不 同 的 处 理 ， 
故 是 独立 的 ， 正 态 性 要 求 不 高 ， 常 不 关注 ; 方差 齐 是 必须 的 ， 因 此 需要 进行 齐 性 的 验证 。 

实战 步骤 

(1) 打开 数据 集 datal10.1.sav， 分 析 一 比较 平均 值 一 单 因素 ANOVA 检验 ， 弹 出 图 10-3。 

(2) 图 10-3 中 , 将 “期 末 考 试 成 绩 ” 放 入 “ 因 变 量 列表 ” 框 ; 将 “教学 方法 ” 放 入 “ 因 
i 

(3) 点 击 参 数 按钮 “选项 ”， 弹 出 图 10-4， 其 中 务必 勾 选 “描述 ”和 “方差 齐 性 检 
验 ”, 因为 描述 是 帮助 我 们 拿 到 三 个 核心 基本 统计 量 , 方差 齐 性 检验 为 方差 分 析 必 备 检验 。 
其 他 非 必 须 放 过 。 点 击 “ 继 续 ”， 回 到 图 10-3。 

(4) 再 点 击 参数 设置 按钮 “事后 比较 ”， 弹 出 图 10-5。 这 步 的 目的 是 如 果 方 差分 析 
发 现 三 组 间 是 有 差异 的 , 到 的 是 哪 两 组 有 差异 , 还 是 三 组 间 全 部 都 有 差异 ,需要 进行 分 析 。 

(5) 图 10-5 中 勾 选 “LSD” 和 “SNK” 法 进行 讲解 演示 ， 上 点击“ 继续” 再 次 回 到 
图 10-3。 上 点击“ 确定 ”运行 。 
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图 10-3” 单 因 隶 ANOVA 检验 


S-N-K 活 勒 - 邮 肯 (0W) 

| 回 厚 砷 伦 尼 四 ) 图 基 [T) [类 川 类 误差 率 ; |100 

| 回 斯 达 克 遇 图 基 s-MK) 加 邮 尼 特 {E) 

| 回 委 奖 (C) 邓肯 侣 ) 控制 类 别 0) ; | 最 后 宇 宗 

| 回 RE-G-WF 重 幸 伯 格 GT2(H) ”以 验 

| 回 RE-G-Wa 加 布 里 埃 尔 (G) 加 双 侧 2) 仿 = 控制 提 ) 全 = 控制 (N) 


不 假定 等 方差 
| 同 深 姆 黑 尼 T2(M) 邓 尼 特 T3 芋 如 斯 - 豪 厄 尔 (A) 邓 尼 特 CU) 


BF) 


图 10-5 “事后 多 重 比较 选项 设置 


结果 解读 

(1) 三 种 教学 方法 的 3 个 核心 基本 统计 量 , 见 图 10-6(A)，, 传统 教学 均 分 为 62.88 分 ， 
PBL 教学 为 65.53 分 ， 翻 转 课堂 为 71.61 分 。 看 似 有 一 定 的 差异 ， 但 有 可 能 是 误差 导致 ， 

(2) 检验 三 组 方差 是 否 相 同 : 见 图 10-6 (B) ， 显 著 性 (P) =0.692>0.05， 按 照 “ 大 
同 小 异 ” 的 口诀 ， 三 组 方差 相同 ， 可 以 进行 后 续 方 差分 析 。 

(3) 方差 分 析 结 果 : ANOVA (analysis of variance) 就 是 方差 分 析 英 文 的 缩写 ， 见 
10-6(C) ， 我 们 发 现 f=7.905，P=0.001， 按 照 “ 大 同 小 异 ” 的 口 记 ， 三 组 间 的 考试 
成 绩 有 差异 。 然 而 只 知道 有 差异 ， 谁 和 谁 有 差异 不 清楚 ， 需 要 进一步 两 两 比较 。 
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随 素 考试 成 靖 


平均 值 的 95% 痪 信 区 癌 
FRR 一 最 小 六 最 大 性 
5566 G50 4 7 


62.04 69.03 46 日 3 
E827 7T4.96 50 92 
4 .95 66.93 45 92 


1317770 


组 内 7669.351 
总 计 8986.121 


ET 685 
83.352 


图 10-6 单 因 系 ANOVA 结果 


(4) LSD 法 两 两 比较 : 见 图 10-7 (A) ， 看 标注 框 中 “显著 性 ”一 栏 ， 凡 是 显著 性 
(P) <0.05， 表 示 两 者 之 间 有 差异 。 结 果 发 现 翻 转 课堂 与 传统 教学 差异 有 统计 学 意义 ， 翻 
转 课堂 与 PBL 差异 有 统计 学 意义 ; PBL 与 传统 教学 差异 无 意义 。 


(5) SNK 法 两 两 比较 ， 
用 心 读 一 读 哦 ， 本 例 SNK 法 认为 三 种 教学 方法 可 以 分 为 2 组 ， 


见 图 10-7 (B》。 很 多 人 反映 看 SNK 结果 存在 困难 ， 这 里 


蚀 转 谍 鞋 目 成 1 组 PBL 


和 传统 教学 为 1 组 ;那么 翻转 课堂 就 分 别 和 PBL、 传 统 教学 有 差异 ; 而 传统 教学 与 PBL 


事后 检验 
A 地租 比 较 
因 严 量 。 姑 未 考试 成 请 
到 [LE LE 一 平 挡 | ee 悄 竹 


LsD | 对 py a I 3 2.357 
I 泣 转 课 世 -8.731 2273 
| PBL 教学 传统 教学 2.650 2.357 
I 筒 转 昌 党 -6.081 2.272 
| 二 怀 评 全 传统 才学 3 
I PBL 攻 学 | 6.081 2.272 
. 平均 值 鞭 值 的 显著 性 水 平 为 已 05， 


齐 性 子 集 


S-N-K ， 传 琉 教 尝 304 62.88 
PBL 教 学 30 85.53 
本 351 71.61 4 
著 | 026 10001 


] | 
征用 调和 平均 值 样本 大 = .S00 


b. 于 大 小 平 粗 等 * A 下 的 调和 平均 人 = 天 法 
保证 1 涩 误 兰 刘 巾 


-7.33 
0000 | 1324 
-203 
0.009 | -10.59 


图 10-7 LSD 和 SNK 法 事后 比较 


Fe 号 允 置信 区 同 
人 | 


上限 


了 .0 
= 二 -了 
7.33 
-4.597 
19.24 


10.59 


无 差异 。 结 果 和 SLD 法 一 致 。 

(6) 结合 图 10-6 (A) ， 可 以 认为 翻 
转 课 堂 教 学 效果 最 好 ，PBL 和 传统 教学 无 
二 异 。 

经 验 心得 

1. 事后 检验 两 两 比较 : SPSS 提供 了 
14 种 用 于 组 间 方 差 齐 时 两 两 比较 的 方法 ; 
而 方差 不 齐 时 提供 了 4 种 方法 ， 共 18 种 。 

2. 方差 不 齐 时 虽然 提供 了 4 种 两 两 比 
较 的 方法 ， 但 业界 主流 学 派 还 是 认为 方差 
不 齐 不 应 该 采用 方差 分 析 ， 故 存在 争议 ， 
建议 大 家 方差 不 齐 还 是 采用 非 参 数 检验 。 

3. 方差 齐 时 的 14 种 方法 : 见 图 10-8， 
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虽然 有 每 种 方法 的 算法 介绍 ， 但 对 初学 者 往往 还 是 无 法 选择 ， 下 面 简单 介绍 一 下 : 


事后 检验 方法 说 明 
适用 条 件 


最 小 显 堵 性 差异 法 。 用 + 检验 完成 组 间 成 对 均值 的 比较 , 检验 的 敏感 度 较 遍 ， 


LSD 法 即使 各 个 水 平 间 的 均值 仓 在 细微 差别 也 能 被 检验 出 来 ， 但 此 法 对 第 工 类 弃 
真 错误 不 进行 控制 和 调整 
为 修正 最 小 显著 性 差异 法 ， 用 + 检验 完成 组 间 成 对 均值 的 比较 ， 即 通过 设 
Bonferroni 法 置 每 个 检验 的 误差 率 来 控制 整个 误差 率 ， 采 用 此 法 看 到 的 显 闭 值 是 多 重 比 
较 完成 后 的 调整 值 


OE ER 
I Bonferroni 方法 的 界限 要 小 


当 各 组 人 数 不 相 等 或 者 想 进行 复杂 的 比较 时 ， 用 此 法 比较 合适 。 对 所 有 可 
能 的 组 合 进行 同步 进入 的 均值 配对 比较 。 该 方法 用 来 检验 组 间 所 有 可 能 的 
线性 组 合 ， 而 不 只 是 成 对 组 合 ， 并 控制 整体 显著 性 水 平等 于 0.05。 该 法 相 
对 保守 ， 有 了 时候 方差 分 析 有 显著 性 差异 ， 但 用 此 法 却 发 现 不 了 差异 
R-FE-G-WF 法 | 是 用 F 检 验 进 行 多 重 比 较 

根据 Student 极 差 统 计量 的 多 重 比 较 

使 用 1 范围 分 布 在 均值 之 间 进 行 折 有 成 对 比较 ， 同 时 使 用 步 进 式 过 程 比较 
二 S-N-K 法 具有 相同 样本 大 小 的 同类 子 集 内 的 均 什 对。 均值 按 从 高 到 低 排 列 ， 首 先 检 
ed 验 极端 的 差分 值 
使 用 1 范围 统计 量 进行 组 间 所 有 成 对 比较 ， 并 将 实验 误差 率 设置 为 所 有 成 
对 比较 的 集合 误差 率 
用 Student-Range 统计 量 进 行 有 所 有 组 间 均 值 的 配对 比较 ， 其 临界 值 是 
Turkey 和 S-N-K 的 相应 值 的 平均 值 


在 进行 配对 比较 时 ， 使 用 逐步 顺序 进行 计算 得 出 结果 ， 与 S-N-K 检验 顺序 
Duncan 法 一 样 ， 但 不 是 给 每 个 检验 设 定 误差 率 ， 而 是 给 所 有 的 检验 的 误差 率 设 定 一 


Scheffe 法 


Turkey 法 


个 临界 值 
使 用 学 生化 最 大 系数 的 多 重 比较 和 范围 检验 ， 与 Turkey's 真实 显 闭 性 差异 


Hochberg’s GT2 法 


用 正 态 标准 系数 进行 配对 比较 ， 但 单元 数 不 等 时 ， 它 通常 比 Hochberg's 
GT2 法 更 强大 ， 但 当 单元 数 变 化 过 大 时 ， 该 检验 可 能 会 变 得 比较 随意 
使 用 7 检验 进行 多 重 比较 ， 使 用 贝 叶 斯 过 程 的 多 重 比较 检验 ， 需 要 在 输入 
框 中 指定 类 型 I 和 类 型 工 的 误差 比 

用 7 检验 进行 配对 比较 ， 先 指定 一 组 与 其 他 各 组 比较 。 选 中 此 法 ， 其 下 “ 控 
制 类 别 ” 下 拉 列表 和 “检验 ”选项 栏 被 激活 。 “控制 类 别 ” 列 表 含 最 后 一 个 
和 第 一 个 两 项 。“ 检 验 ” 栏 中 选择 1 检验 方法 有 双 侧 、 左 控制 和 右 控制 3 项 


Gabriel 法 


DunnetttG19: | 表示 用 Student-Range 极 差 统计 量 进行 配对 比较 检验 


图 10-8 事后 比较 选项 
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(1) LSD 法 是 最 灵敏 的 方法 ， 意 即 如 果 有 差异 ，LSD 法 最 先 发 现 ， 如 果 LSD 都 发 
现 不 了 差异 ， 其 他 方法 也 发 现 不 了 ， 正 因为 太 灵敏 ， 因 此 较 容 易 犯 假 阳 性 的 错误 ; 

(2) Sidak 法 : 是 对 LSD 法 的 适度 校正 ， 结 果 比 LSD 法 保守 ; 

(3) Bonferroni 法 : 是 对 LSD 法 的 严格 校正 ， 结 果 更 加 保守 ， 但 当 组 数 较 多 时 ， 较 
难 发 现 组 间 差 异 。 

(4) Dunnett: 用 于 多 个 实验 组 与 一 个 对 照 组 比较 。 

(5) SNK、Duncan 和 Turkey 利用 的 是 同 质 亚 组 的 思想 ， 其 中 SNK 法 常用 。 


> 10.2 随机 区 组 设计 方差 分 析 


随机 区 组 设计 又 称 为 配伍 组 设计 ， 为 配对 设计 的 扩大 化 。 当 设计 采用 随机 区 组 ， 而 
效应 指标 为 计量 变量 时 ， 优 先 考 虑 就 是 随机 区 组 设计 方差 分 机。 其 条 件 依然 为 : 独立 、 
正 态 和 方差 齐 性 。 

随机 区 组 设计 模式 图 如 图 10-9， 数 据 整 理 格 式 见 
图 10-10，SPSS 数据 录入 格式 见 图 10-11， 依 旧 为 行 
列 式 ， 每 行 代表 一 个 受 试 对 象 ， 每 列 代表 一 个 变量 ， 
本 例 有 三 个 变量 ， 区 组 变量 和 干预 组 变量 为 研究 因素 
图 10-9 ”模式 图 变量 ， 体重 为 效应 变量 。 


区 组 号 时 乙 办 
] 49. 10 56, 20 62. 50 
2 49. 80 48, 50 62. 40 
3 55. 10 54. 80 58, 60 
4 03. 50 64. 20 73. 50 
5 72. 20 66. 40 79. 30 
6 41. 40 45, 70 37, 40 
? 61. 90 53. 00 51. 20 
8 42. 20 37. 80 46.20 上 EE 
图 10-10 ”数据 整理 格式 图 10-11 随机 区 组 数据 录入 格式 


案例 实战 
茶 研 究 者 用 甲 、 乙 、 两 三 种 不 同 的 饲料 喂养 鼠 ， 目 的 是 了 解 不 同 饲料 增 重 的 效果 有 
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无 差异 ， 采 用 随机 区 组 设计 的 方法 ， 以 离别 作为 划分 区 组 的 特征 ， 以 消除 遗传 因素 对 体 
重 的 影响 ， 获 取 数 据 见 data10.2.sav。 请 试 做 分 析 。 

案例 解析 

1. 本 例 为 了 消除 遗传 因素 影响 ， 以 寅 别 作为 配伍 的 条 件 ， 同 一 寅 老鼠 找 3 只 体重 相 
近 的 作为 一 个 配伍 组 ， 然 后 每 个 配伍 组 中 3 只 老鼠 随机 分 配 到 三 个 干预 组 中 去 。 

2. 主要 研究 因素 为 饲料 ， 分 为 甲 、 乙 、 两 三 个 水 平 。 区 组 因素 分 为 8 个 水 平 ; 统计 
上 一 般 主要 研究 因素 是 研究 的 主要 目的 ， 区 组 因素 一 般 是 为 了 控制 消除 其 影响 的 。 实 验 
效应 指标 为 体重 增加 量 〈g) ， 为 计量 数据 。 

实战 步骤 

1. 调用 : 打开 数据 集 datal10.2.sav， 分 析 一 一 般 线性 模型 一 单 变 量 ; 弹出 图 10-12 单 


图 10-12 单 变量 分 析 窗 口 
2. 功能 窗口 设置 将 “体重 ” 放 入 因 变 量 、 将 “区 组 ”和 “干预 组 ” 放 入 固定 因子 ， 
如 图 10-12 所 示 。 
3. 参数 窗口 设置 。 


(1) 模型 参数 设置 ( 见 图 10-13) : 点 击 “ 定 制 ”， 然 后 将 “区 组 ”和 “干预 组 ” 
放 入 模型 变量 杠 ，“ 构 建 项 ”选择 “ 主 效应 ”， 点 击 “ 继 续 ”。 不 能 选 全 因子 ， 因 为 
全 因子 是 用 于 分 析 交 互 作用 的 ， 随 机 区 组 设计 是 不 分 析 交 互 作用 的 ， 区 组 和 干预 组 变量 
要 分 别 放 入 右 框 ， 同 时 选中 放 入 会 变 成 交互 项 。) 

(2) 事后 比较 参数 设置 ( 见 图 10-14) : 因为 区 组 和 干预 组 均 为 多 组 ， 故 都 需要 事 
后 比较 ， 将 区 组 和 干预 组 放 入 事后 比较 框 ， 两 两 比较 方法 选择 LSD 和 SNK。 
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| 『 指定 各 型 
| osmzrw 


由 | | ' 放 EE 


pe 随机 区 组 设计 模型 属性 设置 

(3) 选项 设置 〈 见 图 10-15〉: 将 区 组 和 干预 组 放 入 显示 均值 框 ， 下 面 的 比较 主 效 
应 无 须 勾 选 ， 因 为 事后 比较 已 经 设置 过 了 ， 如 果 勾 选 则 会 重新 分 析 ; 显示 部 分 义 选 描述 
重复 ， 故 方差 齐 性 无 法 


置信 区 同调 整 (N) : 
LsD ( 
i 关 员 类 识 荐 率 : |100 | ILsD { 范 ) 
回 邓 尼 特 (E) 
控制 类 gjY) : 。 轿 吉 = 


置信 


图 10-14 多 重 比较 图 10-15 单 变量 选项 设置 


4. 参数 设置 完毕 ， 回 到 图 10-12， 单 变量 分 析 窗 口 ， 点 击 “确定 ”运行 。 
图 10-12 单 变量 分 析 窗 口中 ， 因 变量 为 计量 类 型 的 效应 指标 。 固 定 因子 : 放 入 已 知 
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全 部 分 类 类 型 的 计数 资料 ， 如 血型 ， 只 有 A、B、O 和 AB。 如 性 别 ， 只 有 男 和 女 ;， 随 机 
因子 : 本 身 为 连续 性 资料 ， 本 次 实验 分 组 为 其 中 的 一 些 点 值 分 组 ， 如 温度 ， 温 度 的 级 别 
太 多 了 ， 但 我 们 安排 实验 的 时 候 比 如 说 安排 了 30 度 、40 度 和 50 度 ， 那 么 此 时 的 温度 分 
组 就 应 该 进入 随机 因子 框 ， 当 某 因 素 为 协 变量 时 ， 应 该 放 入 协 变量 框 ， 详 见 后 续 协 方差 ; 
权重 变量 框 用 得 较 少 ， 常 用 于 处 理 频 数 表 资 料 或 者 混合 样本 数据 。 

结果 解读 

随机 区 组 设计 得 到 的 前 三 张 表 可 忽略 ， 第 一 张 表 反映 试验 因素 的 安排 ， 第 二 张 以 单 
元 格 为 单位 计算 三 个 核心 基本 统计 量 ， 第 三 张 表 是 方差 齐 性 检验 ， 对 其 他 类 型 的 方差 分 
析 很 重要 ， 但 随机 区 组 因为 无 重复 ， 故 无 法 计算 。 主 要 结果 解读 如 下 : 

1. 主体 间 效 应 检验 

见 图 10-16, 干扰 信息 较 多 ， 获 取信 息 如 图 中 标示 框 “ 两 行 两 紧 ”， 共 4 个 数据 ,这 4 
个 数据 是 我 们 需要 报告 的 数据 , 即 Fxg=13.521, P=0.000; Fa =2.719，P-0.101。 因 此 ， 
根据 “大 同 小 异 ” 口 诀 ， 不 同 区 组 老鼠 体重 增加 有 差异 ， 而 不 同 饲料 组 间 体 重 增加 无 


差异 。 
主体 间 效 应 检验 
修正 模型 。” ”2563.8073 9 2848671| 11120 0.0001 
a | | 
74025 934 1 74025934! 2889750 0000 
1 i i i ss ss i Bl Bs Bs Bs Es ms ms ss sl ss ss ms ms ms ms ms ws ws ws ey ee eed 
| 区 组 2424.510 7 346.359! 13.521 0.000 
1 干预 组 139.293 2 696461 2719 0.101 
i NE EE EE Es : 
总 计 76948.370 24 | 
修正 后 总 计 。 2922.436 23 | 1 
a.R 方 =.877 (调整 后 R 方 =.798) 
图 10-16 主体 间 效 应 检验 结果 
2. 区 组 与 干预 组 描述 统计 


见 图 10-17 中 加 框 部 分 ， 图 10-17 (A) 为 各 区 组 的 均值 与 标准 差 : 图 10-17 (B) 为 
各 干预 组 的 均值 与 标准 差 。 

3. 区 组 两 两 比较 结果 

图 10-18 为 采用 LSD 法 的 两 两 比较 结果 ， 因 为 表格 过 长 ， 选 取 了 部 分 截图 ， 看 图 中 
显著 性 栏 ， 凡 是 P<0.05， 则 两 者 间 有 统计 学 差异 ; 图 10-19 为 SNK 法 结果 ， 多 数 情况 下 
两 者 结果 一 致 ， 如 果 有 差异 ， 一 般 都 是 LSD 法 发 现 的 差异 比 SNK 法 多 。 
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95% 置信 区 问 和 多重 比较 
| 区 ! 平均 科 ”标准 误差 【 ”下限 上 限 因 迹 最 ; 体重 i 
| 1 55.933 2.922 | 49.666 62.201 平均 值 关 值 小 - 1 35 和 j 置信 区 问 
| 2 53.567 2.922 | 47.299 。 59.834 也 区 组 伸 区 组 i: 下 限 上 限 
| 3 56.167 2922 | 49899 。 62434 LSD 1 2 2.3667 413253 1 0.576 ! -6.4967 11.2301 
| 6 72 633 2922 1 66366 78.901 4 11.1333 4.13253 | 0017 1 -19.9967 -2.2699 
| 6 41.500 2.922 1 35233 47.767 5 -16.7000 ”413253 ! 0001 1-25.5634 -7.8366 
7 55.367 2.922 | 49.099 。 61.634 6 14.4333 413253 | 0004 1 55699 。 23.2967 
| 8 42.067 2.922 1 35799 48.334 7 0.5667 413253 1 0893 | -8.2967 9.4301 
PO 8 13.8667” 413253 1 0005 | 5.0033 22.7301 
2 干预 引 2 1 -2.3667 4.13253 4 0.576 1-11.2301 6.4967 
ee 3 -26000 413253 | 0539 1-114634 6.2634 
习 变 量 : 体重 | 
王 变 : - 一 4 .13.5000” 4.13253 0006 1-22.3634 -4.6366 
人 5 190667 413253 4 0000 |】 279301 -10.2033 
1 二 而 组 。 平均 值 。 标准 误差 | ” 下限 E 随 有 
1 甲 54 400 1.789] 0 56 58 ?738 6 12.0667 4.13253 | 0.011 3.2033 20.9301 
| 工 53.325 1.789! 49.487 57.163 7 -1.8000 413253 4 0670 1-10.6634 7.0634 
1 丙 58.888 17891 55050 62.725 8 11.5000” 413253 | 0015 2.6366 20.3634 
10-17 区 组 与 干预 组 摘 述 统计 图 10-18 LSD 事后 比较 结果 
体重 
于 集 
__ 区 组 个 素数 _ < 3 4 
S-N-K* 6 3 141.50001 
8 3 420667 maa 
j 
2 3 wmmmni 535667] 
7 3 1 55. 36671 | 55 3667 | 
1 3 1 55.933311 55.93331 
3 3 1 56166711 56.16671 
4 3 1.6 67.06671 167.0667 
= | 
5 3 172.6333 3 | 
ss ss SS 三 三 三 = 
显著 性 0.893 0.921 0.057 0.199 
将 显示 齐 性 子 集 中 各 个 组 的 平均 值 
基于 实测 平均 值 


误 羡 项 足 均 方 【误差 )= 25.617 。 
a. 使 用 调和 平均 值 样 杰 大 小 = 3.000 。 
b.Alpha = 0.05 。 


图 10-19 SNK 事后 比较 结果 


en aon ll 

四 10-20 和 图 10-21 分 别 为 干预 组 LSD 法 和 SNK 法 检验 的 结果 。LSD 法 发 现 乙 和 
丙 差 异 有 统计 学 意义 ，P=0.045<0.05; 而 SNK 法 认为 三 组 同属 于 一 个 亚 组 ， 三 组 无 差异 。 

那么 这 题 到 底 有 无 差异 呢 ? 因为 前 面 方差 分 析 已 经 发 现 干预 组 间 差 异 P=0.101， 无 
差异 ， 因 此 后 续 理 应 不 再 进行 两 两 比较 ， 即 使 比较 也 无 差异 ， 如 SNK 法 。LSD 法 有 差异 
因为 其 过 于 敏感 ，I 类 错误 风险 较 大 。 


多 重 比 入 


平均 悄 差 值 人 
们 干预 组 (J 干预 J 


| 
标准 误差 【显著 性 | 下 限 上 限 
1.0750 2.53065 1 0677 | -43527 6.5027 
| 0098 | .99152 0.9402 


内 -4.4875 2.53065 


3 -1.0750 2.53065 0.677 1 -6.5027 4.3527 
站 -5.5625 2.53065 | 0.045 | -10.9902 -0.1349 
二 异 4.4875 2.53065 1 0.098 | -0.9402 9.9152 
乙 5.5625 2.53065 0.045 | 01348 10.9902 


基于 实测 平均 值 。 
误差 项 是 均 方 (误差 = 25.617 ， 


“平均 值 差 值 的 显著 性 水 平 为 0.05 。 


10-20 干预 组 LSD 法 结果 
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体 主 peeeee | 

华 | 

干预 组 “个案 数 1 | 

S-N-K*P 己 B [533755 | 

四 8 154.4000 1 

丙 8 158.8875 | 

显著 性 | 0.106 ! 

本 显示 齐 性 子 集中 各 个 组 的 平均 值 和 ===== 
甘于 实测 平均 值 


误差 项 是 均 方 【 误 莽 ) = 25.617 : 
a. 使 用 调和 平均 值 样本 大 小 = 8.000 ， 
5. Alpha= 0.05 - 


10-21 干预 组 SNK 法 结果 


经 验 小 结 
随机 区 组 设计 ， 每 个 单元 只 有 一 个 数据 ， 因 此 软件 无 法 计算 方差 齐 性 检验 。 随 机 区 
组 设计 一 般 试 验 性 研究 较 多 ， 社 会 科学 类 研究 较 少 使 用 。 


> 10.3 析 因 设计 方差 分 析 


析 因 设计 是 多 因素 多 水 平 全 面 组 合 的 一 种 设计 方法 ， 两 个 或 多 个 因素 如 果 存 在 交互 
作用 ， 表 示 各 因素 不 是 各 自 独 立 的 ， 而 是 一 个 因素 的 水 平 有 改变 时 ， 男 一 个 或 几 个 因素 
的 效应 也 相应 有 所 改变 ; 反之 ， 如 不 存在 交互 作用 ， 表 示 各 因素 具有 独立 性 ， 一 个 因素 
的 水 平 发 生 改变 时 不 影响 其 他 因素 的 效应 。 析 因 设 计 中 2x2 析 因 设计 是 指 有 两 个 研究 因 
素 , 分 别 是 2 水平, 所 以 一 共 构 成 4 个 单元 , 即 4 组 2x3x4 表示 三 个 研究 因素 , 分 别 为 2、 
3 和 4 个 水 平 ， 所 以 一 共 构 成 24 单元 (组 ) ， 但 分 组 越 多 则 实验 实施 难度 越 大 ， 实 验 动 
物 消耗 也 越 多 ， 因 此 析 因 设计 往往 用 于 研究 因素 或 者 水 平 数 不 多 的 情况 ， 当 研究 因素 
较 多 时 ， 我 们 可 以 采用 正 交 设计 或 者 均匀 设计 ， 本 节 以 2x2 析 因 设计 为 例 进行 讲解 。 

正式 学 习 之 前 ， 先 了 解 下 析 因 设计 的 几 个 概念 : 单独 效应 (simple effects) 、 主 效应 
(main effects) 与 交互 效应 (interaction) 。 单 独 效应 是 指 其 他 因素 水 平 固 定时 ， 同 一 因 
素 不 同 水 平 之 间 的 差异 。 如 单 因素 设计 方差 分 析 不 同 组 之 间 的 试验 效应 的 差异 ; 主 效应 
是 指 某 因 系 各 单独 效应 的 平均 效应 ， 即 某 一 因素 各 水 平 之 间 的 平均 差别 ; 交互 效应 是 指 
如 果 某 因素 的 单独 效应 随 着 男 一 因素 的 水 平 变化 而 变化 , 则 称 这 两 个 因素 存在 交互 作用 。 
2x2 析 因 设计 模式 图 见 图 10-22。4 因素 (2 水 平 ) xB 因素 (2 水 平 ) ， 共 4 个 单元 ， 本 
模式 图 中 每 个 单元 10 个 受 试 对 象 。 
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B 处 理 A 处 理 
让 不 用 
1 3.00 2.79 | ' 5. 40 5. 011 
12.86 2.73 | 1 4.70 3.99| 
用 1 3. 12 1.98 | 1 4.01 4.56| 
12.98 3.031! ! 4.87 4. 19! 
3 20) It 4 
! 4. 45 3.40 | 17. 94 6.88| 
13.20 3.581 17. 88 8. 021 
不 用 13.90 3.11! 18. 60 6. 90! 
14.30 5.02! 16. 45 6. 541 
14.00 4.041 17. 14 7. 31! 


图 10-22 2x2 析 因 设计 模式 图 


案例 实战 

某 研究 者 研究 两 种 药物 4、B 对 红细胞 增加 数 的 影响 ， 采 用 2x2 析 因 设计 ， 选 取 了 
20 只 实验 鼠 进 行 了 实验 ， 获 得 实验 效应 数据 ， 见 data10.3.sav， 问 4、B 两 种 药物 对 红 细 
胞 增加 有 无 作用 ? 4、B 因素 之 间 有 无 交互 作用 ? 

案例 解析 

1. 本 例 研究 2 个 因素 4 药 和 B 药 ,分 别 为 用 和 不 用 两 个 水 平 ， 全 面 组 合 ， 共 构成 4 
个 单元 ， 即 4 组 。 

2. 干预 因素 有 2 个 ， 实 验 效应 指标 红细胞 增加 数 为 计量 资料 。 

实战 步骤 

1. 调用 单 变量 : 案例 数据 data10.3.sav， 菜 单 分 析 一 一 般 线 性 模型 一 单 变 量 ， 弹 出 单 
变量 功能 窗口 〈 见 图 10-23) 。 

2. 单 变量 主 对 话 设 置 : 如 图 10-23 将 RBC 放 入 因 变 量 ，4 药 和 B 药 放 入 固定 因子 。 

3. 模型 参数 设置 : 点 击 “ 模 型 ”， 弹 出 图 10-24， 因 为 本 例 为 析 因 设 计 ， 因 此 需要 分 
析 交 互 作 用 ， 因 此 选择 默认 的 “全 因子 ”， 上 点击“ 继续 ”返回 。 


平方 和 o) 国 问 | 局 在 模型 中 包括 琉 中 由 


图 10-23 单 变量 对 话 框 图 10-24 单 变量 : 模型 
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4. 事后 比较 参数 设置 : 因为 本 例 4 药 和 B 药 均 只 有 2 个 水 平 ， 水 平 数 不 超过 3， 因 
此 无 须 两 两 比较 ， 如 果 你 愿意 勾 选 ， 软 件 会 给 出 警告 ,但 也 会 计算 ,但 除了 浪费 计算 机 


莉 : 反击 “选项 ”， 弹 出 图 10-25。 将 4、B 和 A*B 放 入 “显示 下 列 各 
项 的 平均 值 ” 框 ， 显 示 勾 选 “描述 统计 ”和 “方差 齐 性 ”， 点 击 “ 继 续 ”， 回 到 功能 窗口 ， 
凡 击 “确定 ”运行 。 


和 
比较 主 效应 (OD) 


置信 区 奖 调 整 (N) : 
|LSD (无 ) 


和 


里 壮 性 水 平 (V) : 轻信 区 间 为 95.0% 


图 10-25 单 变量 :选项 


结果 解读 

1. 各 单元 3 个 核心 基本 统计 量 ， 见 图 10-26。 各 单元 的 均值 效应 见 标示 框 。 

2. 各 单元 方差 齐 性 检验 ， 见 图 10-27， 可 见 levene 齐 性 检验 f=0.722，P=0.554> 
0.05， 按 照 “ 大 同 小 异 ” 的 口诀 ， 各 组 方差 齐 ， 可 以 进行 后 续 方 差分 析 。 


| 

1 0980 1 01304 5 

总 计 1 0.840 1 0.2011 10 
1 0 | 1.220 4 0.0837 5 

1 | 2100 4 0.1581 5 

剖 计 1 1.660 1 0.4789 10 
总 计 0 1 0.9601 0.2989 10 epg 一 一 一 
检验 "各 个 组 中 的 因 变 最 误 着 方差 相等 "这 一 原 

1 | 1540 4 06059 10 假设 。 

总 i 1 1.2504 05520 20 | 

- ee a. 设计 :项 中 +A+B+A*B 


图 10-26 统计 描述 结果 图 10-27 方差 齐 性 结果 
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3. 主体 间 效 应 比较 : 见 图 10-28，2x2 析 因 设计 看 法 为 “三 横 两 紧 ”， 如 图 10-28， 
得 到 FE=181.730，P=0.000，F;=90.919，P=0.000; 包 ,s=24.324，P=0.000。P 均 小 于 0.05， 


说 明 4 药 和 B 药 均 有 效 ， 同 时 4*B 药 之 间 存 在 交互 作用 。 


主体 间 效 应 检验 
因 变 量 : RBC et 
源 川 次 平 方 和 自由 讼 均 方 | F 显著 性 | 
ea 9250 -1--31250_ 68au189 -0000 
| | 3.362 1 3.362 181.730 0.000 
| 日 1.682 1 1.682 : 90.919 0.000 
[AB 2 0000 | 
误差 0.296 16 0.019 
总 计 37.040 20 | : 
修正 后 总 计 5.790 19 | ] 


a. 尺 方 =0.949 (调整 后 尺 方 =0.939) 


图 10-28 方差 分 析 结 果 
4. 主 效应 与 单独 效应 


结果 图 10-29 为 药物 的 效应 值 描 述 ， 其 中 如 10.29 (A) 为 4 药 的 主 效应 , 图 10-29 (B) 
为 B 药物 的 主 效应 ， 如 10.29 (C) 为 4 和 B 药物 的 单独 效应 。 


1. A 
因 变 量 : RBC 
"== 95% 贸 信 区 间 
5 生平 均值 】 标准 误 装 下 限 上 限 
0 1 0.840 | 0.043 0.749 0.931 
1 1.660 1 0.043 1.569 1.751 
图 2. B 药 物 
因 变 量 : RBC 
pe -| 95% 置信 区 间 村 
8 药物 和平 均值 | 标准 误 羔 F 限 上 限 A 
0 1 09601 0.043 0.869 1.051 单 洼 的 癌 条 (S) : 
1 | 1.540 4 0.043 1.449 1.631 B 
单独 的 图 (P) : 
四 了 全 和 “日 药 物 
因 变 景 : RBC | : 加 更改 {C) | | 除去 但) | 
a 95% 车 信 区 间 rr 
AEi 物 。 B 节 彻 | 平 淆 值 上 1 标准 识 差 ”下 限 ”上 限 
0 0 1 07001 0.061 0.571 0.829 
| 0980 1 0.061 0.851 1.109 
1 0 1 1.220 | 0.061 1.091 1.349 
1 | 21001 0.061 1.971 2.229 
10-29 ”统计 描述 图 10-30 ”轮廓 图 


5. 交互 轮廓 图 
如 果 想 显示 4 和 B 的 交互 效应 的 轮 廊 图， 在 图 10-23 单 变 量 功能 窗口 点 击 参 数 “ 图 ” 
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按钮 ， 弹 出 图 10-30， 按 图 设置 。 则 在 结果 输出 轮廓 图 〈 图 10-31) 。 可 见 两 条 线 不 平行 ， 
如 果 延 长 将 会 交叉 ， 因 此 存在 交互 作用 。 

大 家 试想 一 下 ， 一 个 高 三 的 学 生 高 考 前 夕 谈 恋爱 了 ， 请 问 会 不 会 影响 学 习 ? 虽然 绝 
大 多 数 会 降低 学 业 , 但 也 有 少数 学 生 , 因为 爱情 的 力量 , 相约 清华 北大 而 发 盏 学 习 。 因 此 ， 
本 例 发 现存 在 交互 作用 , 只 是 发 现 因素 之 间 存 在 相互 影响 , 但 是 又 分 为 正 向 的 交互 (协同 ) 
和 反 向 的 交互 ( 捕 抗 ) 。 

正 回 交互 是 4 的 效应 随 着 B 的 增 大 而 增 大 ， 反 问 交 互 是 4 的 效应 随 着 B 的 增 大 而 减 
小 ， 两 种 典型 的 交互 作用 的 轮廓 图 ， 见 图 10-32。 


估算 边际 平均 值 
机 D 


hh 
i | 


0.5 | 
| A A, A, A, 
A 药物 b) 有 ( 正 问 ) 交互 作用 c) 有 (反问 ) 交互 作用 
图 10-31 轮 亡 图 10-32” 正 同 与 反问 交互 


条例 拓展 起 析 因 设计 -单独 效应 程序 .sps - 18M SPSS Statistics 语法 编 辐 号 [ES 
当 析 因 设 计 存 在 明显 的 交互 作用 时 ， 此 [六 人 (和 胡可 看 台所 转折 (分 析 ( 直销 ( 图 了 ( 实用 各 运行 ( 工具 ( 扩展 ( 窗口 大 二 


时 4 和 8 效应 的 比较 就 不 能 采用 主 效应 了 7， | 是 轩 S 四 时 Si 于 于 的 
而 应 该 采用 单独 效应 进行 比较 。 然 而 单独 效 | 图 轩 ,区 有 O00 RE 
应 在 SPSS 中 没有 直接 分 析 的 模块 ， 一 般 采 
用 编程 的 方法 实现 。 对 于 本 例 ， 大 家 可 以 在 
操作 步骤 参数 设置 完毕 后 , 不 要 点 击 “ 确 定 ”， | Ee 
点 击 “粘贴 ”按钮 ， 然 后 在 弹出 的 “语法 ” 
窗口 ， 改 成 图 10-33 即 可 。 

编写 完成 ， 将 光标 移 到 最 后 ， 点 击 工具 图 10-33 析 因 设计 单独 效应 分 析 
栏 ， 绿 色 运 行 箭头 ， 或 者 点 击 菜单 运行 ， 选 择 全 部 ， 即 可 运行 此 程序 。 得 到 主要 结果 〈 见 
10-34) 。 


El i 一 一 一: 一 一 一 一 一 一 
Ws I SPSS Statistics 处 理 程序 就 将 | |Unicode:ON|In8 Col 18| | |CAP 
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成 对 比较 
因 变量 : RBC 
平均 值 差 值 小 eeey 差 值 的 95% 轩 信 区 间 
2 和 2 种 + ) 标准 误差 |! 要 
0 0 1 -0.520 0.086 | 0000 -0702 -0.338 
1 0 0.520” 0.086 Go 0.338 0.702 
i 
1 0 1 1.120 0086 了 0000 | -1.302 0.938 
et 


1 0 1.120 

基于 估算 边际 平均 值 

* 平均 值 差 值 的 显著 性 水 平 为 0.05 ， 
b. 多 重 比较 调节 : 斯 达 克 法 


0.938 1.302 


0086 | 0000 | 


单 变量 检验 
因 变 最 : RBC 本 加 本国 轨 回国 加 本 本 加 晤 
药物 FA 和 ”自由 度 ”” 艾 方 F 如 次 性 | 
0 Ht 0.676 T0701 305 0000 ; 
误 鞋 0.296 16 0.019 1 lL 
1 对 比 3.136 1 3.136 , 169.514 0.000 
误差 0.296 16 0.019 0 | 


每 个 F 都 将 检验 其 他 所 示 效 应 的 每 个 级 别 组 合 中 A 药物 的 疝 
基于 估算 边际 平均 值 之 间 的 线性 无 闫 成 对 比较 


图 10-34 单 变 量 与 单独 效应 结果 


单 变量 结果 发 现 8 药物 在 未 用 (0) 时 ，4 药 用 和 不 用 是 有 差别 的 ， 成 对 比较 的 
P=0.000; 8B 药物 在 用 (1) 时 ，4 药 用 和 不 用 是 也 有 大 列 的 ， 成 对 比较 的 P=0.000; 因为 
上 述 程 序 设置 的 4 和 8 分 别 作 为 对 比 ， 因 此 结果 会 出 现 两 次 。 

错误 辨析 

数据 表现 有 多 种 形态 ， 就 像 同 一 种 疾病 有 不 同 的 表现 型 一 样 ， 有 时 候 东 些 表现 还 会 
误导 疾病 的 诊断 。 正 如 下 面 图 10-35 的 数据 一 样 ， 很 多 的 时 候 ， 大 家 看 到 左 侧 的 数据 ， 
根据 自己 的 经 验 认 为 这 不 就 是 4 个 独立 的 组 吗 ? 采用 单 因 素 设 计 的 方差 分 析 啊 。 可 是 当 
我 们 将 数据 的 形态 转化 为 右 侧 的 时 候 ， 发 现 其 实 它 是 一 个 2x2 析 因 设计 的 方差 分 析 。 如 
果 我 们 采用 的 单 因 素 分 析 ， 一 设计 类 型 不 对 ， 二 会 损失 很 多 的 信息 。 


空 | A | B | A 的 
日 | 药 | 药 |+B 药 


四国 IE 


四 四 四 本 


图 10-35 ”演示 数据 
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二 10.4 重复 测量 设计 方差 分 析 


重复 测量 资料 是 指 对 同一 批 受 试 对 象 的 同一 观测 指标 在 不 同时 间 扣 上 进行 多 次 测量 
所 得 的 资料 ， 其 目的 就 是 观察 不 同时 间 扣 的 动态 变化 趋势 特征 。 因 为 资料 的 类 型 分 为 数 
值 变 量 、 分 类 变量 和 等 级 变量 ， 因 此 重复 测量 数据 分 析 就 会 相应 产生 这 三 类 资料 的 重复 
测量 数据 分 析 ， 因 数值 变量 的 重复 测量 更 为 常用 ， 本 节 讲 解数 值 变量 资料 的 重复 测量 方 
差分 析 。 为 了 让 大 家 更 加 全 面 地 和 掌握， 此 处 讲解 单 组 重复 和 多 组 重复 两 个 案例 ， 由 简单 
到 复杂 进行 讲解 。 

重复 测量 数据 方差 分 析 的 分 析 条 件 如 下 所 述 。 

1. 正 态 性 : 处 理 因素 的 各 处 理 水 平 的 样本 个 体 之 间 是 相互 独立 的 随机 样本 ， 其 总 体 
均 数 服从 正 态 分 布 ; 

2. 方差 齐 性 : 相互 比较 的 各 处 理 水 平 的 总 体 方差 相等 ， 即 具有 方差 齐 同 ; 

3. 各 时 间 点 组 成 的 协 方差 阵 (covariance matrix) 具有 球形 性 (sphericity) 特征 : 
Box (1954) 指出 ， 乔 球形 性 质 得 不 到 满足 ， 则 方 兰 分 析 的 环 值 是 有 偶 兰 的 ， 这 会 造成 
过 多 的 拒绝 本 来 是 真 的 无 效 假设 〈 增 加 了 了 型 错误 ) 。 


案例 实战 一 : 羊 因 素 重 复 测 量 
某 医院 检验 科室 ， 欲 研究 血样 放置 时 间 对 血糖 检测 的 影响 ， 采 了 8 份 人 血 标 本 ， 分 
别 于 放置 0min、4Smin、90min 和 13Smin 对 血糖 进行 检测 ， 得 到 数据 如 下 ， 问 检测 时 间 
是 否 对 血糖 有 影响 ? (数据 集 : data10.4 ) 如 图 10-36 所 示 。 


[| 攻 提 视 冉 | | Eel 


10-36 ”演示 数据 库 
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1. 调用 重复 测量 窗口 

打开 数据 集 ， 分 析 一 一 般 线 性 模型 一 重复 测量 ， 弹 出 
重复 测量 因子 定义 窗口 〈 图 10-37) 。 注 意 此 处 SPSS 有 个 
bug， 本 例 因 为 4 次 重复 测量 ， 因 此 ， 在 级 别 数 里 输入 4， 
然后 点 击 “ 添 加 ”， 提 示 错 误 ! 因为 默认 的 “因子 1” 中 
间 有 个 空格 ， 消 除 空格 即 可 。 但 是 ， 初 学 者 ， 为 了 更 好 理 
解 时 间 的 意义 ， 请 大 家 把 主体 内 因子 名 改 为 “time”， 输 
入 4 个 级 别 ， 然 后 点 击 “ 添 加 ”， 如 图 10-37 即 可 ， 然 后 
点 击 “ 定 义 ” 按 钮 ， 弹 出 图 10-38。 
2. 重复 测量 窗口 设置 

将 4 个 测量 时 间 点 务必 按照 测量 时 间 的 先后 ， 放 入 主 
图 10-37 定义 重复 测量 因子 。 体内 变量 框 中 。 点 击 “ 图 ”按钮 , 弹出 图 10.39, 轮廓 图 设置 ， 
将 time 放 入 水 平 框 ， 点 击 “ 添 加 ”“ 继 续 ”。 


单独 的 线条 (9) : 


主体 问 册子 昌 ) : 


I 单独 的 图 (P) : 


FTTIECOIC 


国 
里 
二 -和 :十 四 加 5 


图 10-38 重复 测量 主 对 话 框 | 图 os 重复 测量 - 轮 廊 图 

3. 选项 按钮 设置 ， 点 击 “ 选 项 ”， 弹 出 图 10-40 

将 time 因子 放 入 显示 均值 框 , 勾 选 “比较 主 效应 ”, 同时 显示 出 勾 选 “描述 统计 和“ 齐 
性 检验 ”。 点 击 “ 继 续 ”， 回 到 重复 测量 功能 窗口 ， 点 击 “ 确 定 ” 运 行 。 
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信 区 间 装 95.0% 


图 10-40 重复 测量 : 选项 


4. 主要 结果 解读 

(1) 多 变量 检验 ( 见 图 10-41): 多 变量 检验 是 一 种 多 元 分 析 方 法 , 因为 本 例 4 次 检测 ， 
类 似 于 结果 效应 指标 同时 有 4 个 的 情况 ， 符 合 多 变量 检验 的 条 件 ， 因 此 ，SPSS 默认 进行 
了 多 变量 检测 ， 其 结果 基本 与 后 面 的 单 变 量 检验 一 致 。 本 例 用 到 四 种 多 变量 分 析 方 法 ，P 
均 小 于 0.05， 因 此 认为 不 同时 间 的 血糖 浓度 是 有 差别 的 。 


多 变量 检验 ” 


i i 
效应 | 全 F 段 设 自由 度 ” 误 革 自由 度 1 ”如 千 全 | 
time TH 羔 轴 渤 1 0954 344745 3000 50001 0001 | 
| 威 尔 克 Lambda! 0.046 34.474t 3.000 50001 0001 1 
| 价 待 林 轨 和 20.684 34.474 3.000 50001 0.001 
| 罗 仇 最 大 根 。 1 20.684 34474 3.000 50001 0001 | 


3. 设计 : 截 距 
主体 内 设计 : time 
b. 精确 统计 


10-41 多 变量 结果 


(2) 球形 度 检验 〈 见 图 10-42) : 重复 测量 方差 分 析 应 该 满足 球形 度 ， 不 满足 则 需 
要 进行 校正 。 本 例 球 形 度 检验 显著 性 P=0.008， 则 不 符合 球形 度 ， 则 后 续 分 析 应 该 采用 
校正 系数 。 下 文 提 到 了 3 种 校正 方法 (Greenhouse-Geisser 法 、Huynh-Feldt 法 和 Lower- 
bound 法 ) ， 相 对 来 说 第 一 种 更 常用 ， 但 一 般 三 种 结论 相差 不 大 。 
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本 


| ”显著 性 


| 格林 豪 斯 - 


主体 内 效应 。 募 奇 来 W 近似 卡 方 自由 度 
time 0.063 15.844 5 
检验 " 正 交 化 和 转 换 后 因 变 最 的 误差 协 方 莽 炬 阵 与 但 等 矩阵 成 比例 ' 这 一 原 假 设 
3a. 设计 : 鼓 配 

E 体 内 设计 : time 


b. 可 用 于 调整 平均 显著 性 检验 的 自由 度 * 修正 检验 料 显 东 在 “主体 内 效 区 内 验 " 表 中 


图 10-42 球形 度 检验 结果 


(3) 主体 内 效应 单 变量 检验 图 10-43 (A) ， 因 为 不 符合 球形 度 ， 所 以 单 变 量 检验 
的 第 一 个 “假设 球形 度 ” 不 可 以 采用 ， 我们 看 第 二 个 ， 格 林 豪 斯 - 盖 斯 勒 (Greenhouse- 
Geisser) ， 发 现 P=0.000， 结 论 与 前 面 多 变量 结果 一 致 ， 均 认为 不 同时 间 血 糖 浓 度 有 差别 。 

10-43 (B) ， 既 然 已 经 发 现 不 同时 间 血 糖 存 在 差异 ， 则 进一步 探讨 血糖 变化 符 
合 什么 样 的 曲线 。 因 为 有 4 次 测量 ， 最 多 拟 合 3 次 曲线 。 下 图 结果 可 见 线性 和 二 次 的 
P<0.05， 意 即 血糖 随时 间 变 化 成 线性 或 二 次 关系 ， 但 是 到 底 哪 个 更 符合 呢 ， 我 们 看 各 自 
的 下 值 ， 线 性 下 值 117.12 大 于 二 次 的 五 值 109.84， 因 此 ， 线 性 关系 更 符合 。 

(4) 成 对 比较 结果 

既然 不 同时 间 点 的 浓度 存在 差异 ， 于 是 便 进 行进 一 步 两 两 比较 ， 结 果 见 图 10-44， 请 
见 “ 显 著 性 ”这 一 栏 ，P<0.05 则 认为 差异 有 统计 学 意义 。 结 果 可 见 各 个 时 间 点 之 间 的 差 
异 全 部 有 统计 学 意义 。 


0.657 0333 | 


主 健 肉 效应 性 验 成 计 出 园 


0.002 * 平均 秆 善 值 的 显著 性 水 平 为 0.05 
0.012 b. 多 重 比 较 曾 节 ; 最低 显著 着 羡 法 (相当 于 不 进行 硬 辟 ] 。 


测量 : MEASURE 1 
time 上 但 设 球形 讼 2.960 3 0.967 791411 0.000 Te 人 ed a 95% Ee 
| 格林 沈 基 i 六 和 2.960 1.585 1.868 79141| 0.000 | (Dtime ns ee i ee | 和 ne 
[a | 地 -种 入 特 I 2.960 1.972 1.501 791411 0000 | | | 
1 下 限 | 2960 100 2960 7914 1 0000 | 3 0.379 DO Do yy 0260 D.497 
齐 蔷 出 me) 。 侦 设 球形 度 0.262 21 Ty 4 0.778" 0.0661 0000 | 0621 0.934 
格林 误 昕 -其 断 肚 0262 11.094 0024 2 1 -0.085 0028 1 0018 | -0.150 -0.020 
条 费 乙 特 262 T3809 0019 3 0.294 0.067 1 0.003 : 0.135 0.452 
Ee 4 0693 00701 0000 | 052 0857 
3 1 -0.379 0.050 | 0000 | -0497 -0.260 
2 -0.294 0067 4 0.003 | -0.453 -0.135 
. -一 4 0 399 0.041 0000 | 0302 0.496 
一 | : 000! 4 1 0778 0.066 0 000 -0934 -0.621 
| 二 次 0.197 1 0.197 109.840 | 0000 | 2 ee 人 0.000 5 5 
1 三 次 | 0.004 | 0 00d O357 | 0569 I 本 -0.399 0.041 O000 | -0.496 -0.302 
误 营 Wimej “9 7 基于 估算 边际 平均 值 
? 
下 


图 10-43 ”重复 测量 方差 分 析 结 果 图 10-44 不 同时 间 的 两 两 比较 结果 
(5) 轮廓 图 : 由 图 10-45 可 知 ， 随 着 时 间 的 延长 ， 血 糖 浓 上 度 呈 现下 降 的 趋势 ， 结 合 
上 面 的 拟 合 结果 ， 应 该 更 符合 线性 下 降 的 趋势 。 因 为 仅 检测 4 次 ， 不 能 全 面 了 解 变化 的 
趋势 ， 如 果 进 一 步 增加 检测 次 数 ， 也 许 能 够 发 现 更 多 的 信息 ， 当 然 这 都 得 基于 研究 者 的 
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目的 进行 考虑 。 


bh 
oo 
全 


hn 
a 
> 


估算 边际 平均 值 
3 BS 8 


a 
QO 
SS 


] 2 4 
time 
图 10-45 不 同时 间 的 血糖 浓度 轮廓 图 

关于 测量 0 时 刻 的 问题 ， 有 学 者 认为 ， 不 应 该 作为 重复 测量 的 第 一 次 测量 ， 因 为 0 
时 刻 受 试 对 象 所 受 的 影响 因 系 与 后 面 不 一 致 ， 因 此 不 适合 ， 但 是 对 于 本 例 不 存在 这 样 的 
问题 ， 因 为 血 一 抽出 来 就 检测 和 后 面 检 测 只 有 时 间 不 同 ， 无 其 他 干预 因素 的 不 同 ， 但 是 
比如 研究 针灸 对 镇 痛 的 影响 ， 未 针灸 前 检测 和 针灸 后 多 次 检测 ， 则 前 后 受 试 对 象 的 均一 
性 融 不 一 致 。 

讲 到 这 里 ， 单 因素 重复 测量 设计 的 计量 资料 分 析 方 法 基本 讲解 完毕 。 单 因素 重复 没 
有 组 间 干 预 措施 的 影响 ， 只 有 主体 内 《时 间 ) 的 影响 ， 下 面 我 们 再 看 看 两 因素 其 中 一 个 
为 重复 测量 数据 方差 分 析 如 何 实践 。 


案例 实战 二 : 两 因素 其 中 一 个 因 率 重复 测量 (1) 

某 研 究 者 欲 研究 两 种 饲料 4 和 B 对 家 禽 的 增 重 效果 ， 随 机 选取 12 只 长 白猪 ， 随 机 

分 成 2 组， 第 一 组 采用 饲料 4， 第 二 组 采用 饲料 有 并 于 实验 开始 的 第 1、2、3 个 月 分 
别 测量 2 组 猪 的 体重 情况 ， 数 据 如 表 10-1 所 示 ， 数 据 库 datal0.5.sav。 


表 10-1 12 只 猪 体 重 增 重 情况 ( kg ) 


测试 时 间 
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测试 时 间 


1. 调用 重复 测量 功能 窗口 

菜单 分 析 一 一 般 线性 模型 一 重复 测量 ， 弹 出 图 10-46。 更 改 默认 重 测 变量 名 “因子 1” 
为 ttme， 级 别 数 为 3， 添 加 入 重 测 框 ， 点 击 “ 定 义 ”,， 弹出 图 10-47。 注 意 SPSS 23.0 版 本 ， 
此 处 有 bug， 因 子 与 1 之 间 有 空格 ， 不 能 运算 ， 可 以 将 空格 删除 ， 或 者 重新 起 名 。 


图 1 10-46 ” 重 测 定义 因子 图 10-47 重复 测量 功能 窗口 


2. 重 测 功能 窗口 设置 

将 时 间 timel、time2 和 tme3 放 入 主体 内 框 ， 切 记 ， 必 须 严 格 按照 时 间 先 后 顺序 放 
入 右 框 。 将 group 放 入 主体 间 因 子 框 。 

3. 三 级 参数 窗口 设置 

(1) 模型 : 保持 默认 ， 即 全 因子 模型 ， 因 为 需要 分 析 交 互 作用 。 这 里 的 交互 作用 是 
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指 不 同 干预 措施 与 时 间 之 间 的 交互 作用 。 
(2) 图 : 将 group 放 入 单独 线条 ，time 放 入 水 平 轴 ， 初 学 者 不 知 如 何 放 入 ， 可 以 颠 
倒 再 做 一 次 ， 看 看 哪个 图 更 好 解释 。 一 般 规 律 : 本 次 你 最 想 表达 的 内 容 放 入 单独 线条 。 
(3) 事后 比较 : 本 例 无 需 做 ， 因 为 goup 只 有 2 组 ,如果 group 有 多 组 ， 此 处 则 需要 设置 。 
(4) 选项 ， 如 图 10-48 将 因子 移入 显示 均值 框 ， 勾 选 “比较 主 效应 ”， 默 认 LSD 法 ， 
也 可 以 勾 选 其 他 2 种 方法 。 再 选择 “描述 统计 ”和 “ 齐 性 检验 ”。 点 击 “ 继 续 ”， 回 到 
图 10-47， 氮 击 “ 确 定 ” 运 行 。 


2 Hi " 
hs ly 上 sme- 。 多 赤 是 衬 验 > 
有 假设 自由 度 。 误 善 自由 度 1 显著 性 
time | 比 药 轨 迹 0.964 122.220 2 000 9000 1 0000 | 
| 威 尔 克 Lambdal 0.036 122.220" 2.000 9.000 1 0000 | 
| 
| 堆 特 林 轨 迹 1 27.160 122.220* 2.000 9.000 | 0000 ! 
站 从 习 闪 | 罗 保 最 大 根 ”| 27.160 122220b 2 .000 90001 0000 1! 
局 分 布 -水 平 图 ) . TS 
time* group 1 比 莱 轨 流 | 0370 2.641 2.000 9.000 1 0.125 
加 车 六 图 区 ) goup 1 | E I | 
四 突 抽 和 1 威 尔 克 Lambdal 0.630 2.641 2.000 9.000 | 0.125 | 
| 
二 右 莽 99cP 矩阵 站 一般 可 信 熏 数 (&) | 罕 特 林 轨 迹 | 0.587 2.641° 2.000 9.000 | 0.125 ! 
8 最 大 根 1 0587 2.641° 2.000 9.000 0.4125 1 
显著 性 水 平 (WJ : [05 。 ] 置信 区 间 为 95.0% | 罗 伐 县 大 村 | \ \ 
ee se. 体内 设计 :me” 
主体 内 设计 : time 


妈 10-48 ” 重 测 选项 设置 图 10-49 多 变量 检验 结果 


4. 主要 结果 解读 

(1) 多 变量 检验 结果 ， 如 图 10-49 所 示 ， 发 现 time 的 趋势 变化 P=0.000<0.05， 因 此 
猪 的 体重 随时 间 发 生 趋势 性 变化 ， groupXxtime 交互 作用 ，P=0.125>0.05， 因 此 ， group 与 
时 间 time 无 交互 作用 。 大 家 试想 一 下 , 目前 的 结果 , 是 不 是 两 种 方法 的 时 间 变 化 趋势 相同 ， 
体重 变化 有 时 间 变 化 趋势 。 

(2) 球 对 称 检 验 ， 如 图 10-50 所 示 ，P=0.618>0.05， 符 合 球 对 称 性 。 可 以 进行 单 变 
量 重 复 测 量 方差 分 析 。 

(3) 主体 内 效应 检验 ， 因 为 上 面 球 对 称 符 合 ， 因 此 可 以 进行 单 变量 重复 测量 检 
验 ， 如 图 10-51 所 示 ， 因 为 符合 球 对 称 ， 直 果 ， 得 到 Fun 一 165.424， 
P=-0.000<0.05， 认 为 体重 变化 具有 时 间 变 化 趋势 。Fimxeom=2，P-0.162>0.05， 认 为 group 
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与 time 无 交互 作用 。 大 家 可 以 发 现 ， 此 处 单 变 量 检验 和 上 面 的 多 变量 检验 结果 是 一 致 的 。 
多 种 方法 一 致 ， 也 更 加 证 明 结果 的 可 靠 。 


莫 奇 来 妹 形 应 检验 
测量 : MEASURE 1 


Epsilon® 
EE 体 内 效应 。 竟 奇 来 时。 近似 卡 方 自由 度 显著 性 四 格林 豪 斯 着 斯 勒 辛 - 费 乙 符 下 限 
0.964 2 0.618 0.908 1.000 0.500 
位 驴 " 正 交 化 转换 后 因 变 量 的 误 羡 协 方差 惩 阵 与 但 等 作 阵 成 比例 这 一 原 假 设 。 
a. 设计 ; 项 距 + group 
主体 内 设计 : time 


b. 可 用 于 调整 平均 显 者 性 检验 的 目 由 度 : 修正 检验 半 显 示 在 主体 内 效应 检验 表 中 


图 10-50 ”球形 度 检验 


L 
I 
I 
time 0.898 | 


主体 内 效应 检验 
_ 测 县 MEASUPE- 
法 川 业 平方 和 自由 度 均 方 F 显著 性 


FT oa 7 09 150 TO 
恪 林 衰 匠 - 盖 斯 勒 90.317 1.816 49744 165.424 0.000 
辛 - 费 德 特 90.317 2000 45158 165.424 0.000 
F 限 90.317 1.000 90.317 165.424 0.000 
Lame, grouP, ,Bee em 1.092 : L062, 
和 格林 豪 斯 - 盖 斯 勒 1.092 1.816 0.601 2.000 0.167 
广 - 费 德 特 1.092 2.000 0.546 2.000 0.162 
F 限 1.092 1.000 1.092 2.000 0.188 
误差 Wime) ”假设 球形 庶 5.460 20 0.273 
格林 豪 斯 - 盖 斯 勒 5.460 18.156 0.301 
六 - 费 钵 特 5460 20000 0.273 
F 限 5.460 10.000 0.546 


图 10-51 重 测 结果 


(4) 主体 内 对 比 。 主 体内 对 比 是 指 不 同时 间 点 的 比较 ， 用 于 验证 体重 的 时 间 变 化 符 
合 线 性 还 是 二 次 关系 ， 由 图 10-52 可 知 线性 的 fF=260.680，P=0.000<0.05， 因 此 ， 可 以 认 
为 体重 变化 符合 线性 关系 。 


主体 内 对 比 答 验 
测 最 : MEASURE_1 
源 time 。 川 业 平方 和 


目 由 度 坷 方 F 亚 者 性 


Ltime 1! 浅 性 90.288 1 90.288 260.680 | 0.000 | 
二 次 0.029 1 0.029 0.146 0.710 
time “group 线性 0.100 1 0.100 0.289 0.603 
一 次 0.992 1 0.992 4.968 0.050 
讽 兰 (tmMme) 线性 3.464 10 0.346 
一 次 1.996 10 0.200 


图 10-52 ”时 间 赵 势 检 验 结果 
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(5) 方差 齐 性 检验 和 主体 间 效 应 比较 。 方 差 齐 性 检验 〈 见 图 10-33) ， 发 现 所 有 P 
均 大 于 0.05， 因 此 方差 齐 ， 适 合 方差 分 林 〈 如 果 方 差 不 齐 ， 可 以 做 GEE 或 多 水 平 模型 ) 。 
主体 间 效 应 发 现 ，group 组 间 比 较 〈 见 图 10-54)〉 f=0.190，P=0.672>0.05，“ 大 同 小 异 ”， 
因此 无 差异 ， 表 示 两 种 方法 对 猪 的 体重 减 重 效果 无 差异 。 


识 盖 方差 的 药 文 等 同性 检验 ” 主体 间 效 应 检验 


F 自由 度 1 自由 度 2 1 显著 性 测量 ”MEASURE 1 
time3 0.044 1 10 0.838 | 转换 后 变量 :平均 
time2 0.523 1 10 1 0.486 ! 源 册 美 平方 员 。 自由 度 。 ” 均 方 F 显著 性 
time1 1.538 1 10 ! 0.243 1 硕 距 540.950 1 540950 124761 0.000 
检验 "各 个 组 中 的 因 变 量 误差 方 症 相等 * 这 一 原 假 设 - | group | 0.825 1 0.825 | 04 90 ”0672 1 

a. 设计 : 规 距 + group 误 苹 43.359 10 4.336 
主体 内 设计 : time 
图 10-53 方差 齐 性 检验 10-54 ”组 间 效 应 比较 


(6) 不 同时 间 操 成 对 比较 ， 从 图 10-55 中 ， 可 以 发 现 采 用 LSD 法 ， 各 时 间 点 卫 均 
小 于 0.05， 说 明 各 时 间 点 的 体重 变化 量 间 均 有 差异 。 图 10-56 为 轮廓 图 ， 可 以 发 现 两 组 
具有 共同 线性 增长 趋势 ， 并 且 相 互 交 织 ， 没 有 差别 。 


成 对 比较 MEASURE 1 的 估算 边际 平均 值 
测量 :MEASURE 1 .0 
1 “平均 信 差 什 ( 人 差 值 的 95% 置信 区 各 
| Mtime Wimel 省 标准 误差 1 显著 性 ” © 下 限 也 地 
1 : | I 9 | 0.000 | 1.401 2.458 PY 
| 3 | 3879 02401 0000 | 3344 -4.415 性 
| 2 1 -1879 02151 0000 | -2358 -1401 Es 
| 3 | 2000 01811 0000 | 1.597 2.403 | 
0 
1 2 | -2.000 0.181 0.000 1 -2.403 -1.597 Ha 


基于 估 复 边际 平均 值 
“. 平均 值 差 值 的 显著 性 水 平 为 0.05 


b. 多 重 比较 调节 ; 最 佐 显 著 盖 异 法 (相当 于 不 进行 调幅 】。 | 2 3 
time 
图 10-55 ”主体 内 两 两 比较 图 10-56“ 轮 廊 图 


讲解 到 这 里 ， 总 结 一 下 ， 本 例 group 与 tme 无 交互 ， 意 思 是 两 组 的 time 效应 是 相同 
的 ， 两 条 线 〈 或 曲线 ) 具有 相同 的 趋势 。 然 后 发 现 time 存在 线性 趋势 ， 此 时 可 以 得 出 两 
组 应 该 是 两 条 趋势 变化 相同 的 直线 〈 注 : 毕竟 只 观察 3 次 , 基于 3 次 数据 的 结果 为 线性 ) 。 
最 终 可 得 两 种 饲料 都 有 效 ， 相 互 间 疗效 无 差别 ， 疗 效 均 呈现 一 致 的 线性 变化 趋势 。 


案例 实战 三 : 两 因素 其 中 一 个 重复 测量 (2 ) 
当 干 预 措施 与 时 间 无 交互 , 分 析 较 为 简单 , 只 要 得 到 time 有 无 意义 , group 有 无 意义 ， 
基本 就 能 够 达到 分 析 的 目的 。 当 干预 与 时 间 存 在 交互 ,不管 是 比较 干预 措施 ， 还 是 时 间 
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点 间 比 较 ， 因 为 存在 交互 ， 都 受 另 一 因素 的 影响 ， 因 此 分 析 就 要 复杂 得 多 。 

案例 实战 

某 研究 机 构 研 究 2 种 饲料 对 小 鸡 的 增 重 效果 ， 随 机 选取 12 只 小 鸡 ， 随 机 分 成 2 组 ， 
每 组 6 只, 分别 饲 以 4 饲料 和 B 人 饲料 , 分 别 于 1 周 、2 周 、3 周 和 4 周末 称 量 小 鸡 的 体重 ， 
数据 如 图 10-57 所 示 ， 试 分 析 两 种 饲料 的 效果 及 时 间 变 化 趋势 。 

案例 解析 

1. 干 预 因素 为 饲料 ， 分 为 2 水 平 ，4 饲料 和 B 饲料 ; 

2. 效应 指标 为 体重 (kg) ， 为 计量 资料 ; 

3. 每 只 小 鸡 在 不 同时 间 点 检测 了 4 次， 重复 测量 设计 ; 

4. 综合 上 述 分 析 ， 优 先 考 虑 重复 测量 数据 的 方差 分 析 。 

1. 调用 重复 测量 因子 设置 框 ; 

菜单 : 分 析 一 一 般 线性 模型 一 重复 测量 ， 弹 出 图 10-38， 如 图 设置 ， 点 击 “ 定 义 ”。 


1 ; 
| l. 
] . 30 
1 2 
| 
2 1. 
2 0.80 1.00 3.00 4.00 
2 . 90 
2 l. 
2 .00 
2 


1.00 2.50 5.00 7.00 
图 10-57 饲料 增 重 数据 10-58 重复 测量 定义 因子 
2. 重复 测量 功能 窗口 ， 如 图 10-59 设置 。 时 间 放 入 主体 内 框 ，group 放 入 主体 间 框 ， 
3. 参数 设置 “图 ”中 将 group 放 入 单独 线条 ，time 放 入 水 平 轴 。“ 选 项 ”窗口 如 
10-60 设置 。 点 击 “ 继 续 ” 回 到 主 对 话 框 ， 点 击 “ 确 定 ” 运 行 。 
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同 33CP 蜡 阵 
问 车 幕 SSCFP 局 际 


星 将 性 水 平 [) : 置 估 区间 车 95.0% 


图 10-$9 ” 重 测 主 对 话 框 设置 图 10-60 ” 重 测 选 项 设置 


1. 多 变量 检验 结果 
见 图 10-61， 解 释 同 前 ， 本 例 tme 对 应 f=38.170，P<0.05， 多 变量 结果 认为 不 同时 
间 点 体重 不 同 。Group 与 tme 存在 交互 作用 ，P<0.05。 


_ 多 变量 检验 = 

] 效应 | 什 F 很 设 自由 度 ” 误差 自由 度 昌 显著 性 1 
| time | 比 蒜 轨 和 迹 0.935 38170 3.000 8.0001 0000 | 
\ | 威 尔 克 Lambda 0.065 38.170 3.000 8.000 | 0.000 | 
| 蛙 特 林 轨 迹 14.314 38.170 3.000 80001 0000 1 
] | 罗 伊 最 大 根 14.314 38.170 3.000 8.0001 0.000 i 
| Ttime * group | 比 莱 轨 秋 0.925 32.887 3.000 8.000 | 0.000 | 
| | 威 尔 克 Lambda 0.075 32.887 3.000 80001 0000 1 
| | 霍 特 林 轨 过 12.333 32.887 3.000 3.000 | 0000 | 
1 名 伊 最 大 根 12333 32887 3.000 8.000 0000 1 

Wm ms ms 


a. 设计 : 截 距 + group 
主体 和 内 设计 : time 


10-61 重 测 检验 结果 


2. 球 对 称 与 主体 内 效应 

结果 见 图 10-62(A)，, 显著 性 P=0.074>0.05, 符合 球 对 称 性 。 主 体内 检验 图 10-62 (B)， 
因为 符合 球 对 称 ， 因 此 只 看 “假设 球形 度 ” 结 果 ，F=102.605，P=0.000<0.05， 说 明 不 同 
时 间 点 体重 变化 存在 差异 。 结 果 和 多 变量 结果 一 致 。 

3. 主体 内 对 比 与 方差 齐 性 

10-62 发 现 不 同时 间 time 存在 差异 ， 但 会 存在 什么 趋势 性 的 变化 呢 ， 图 10-63 (A) 
发 现 线性 和 三 次 均 有 意义 , P<0.05, 因为 仅 测 4 次 ,从 4 次 结果 得 出 函数 关系 本 身 就 有 点 弱 ， 
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本 例 符 合 线性 可 能 性 更 大 ， 因 为 其 f=138.193 远大 于 三 次 的 8.508。 
图 10-63 (B) 为 方差 齐 性 检验 结果 ， 所 有 PP 均 大 于 0.05， 说 明 不 同时 间 点 数据 方差 
齐 性 ， 适 合 进行 方差 分 析 。 


四 竟 奇 来 款 形 座 僧 驻 ” 
误 最 :MEASURE 1 


Epsilon 
Ps I 


ji 。 葛 奇 来 W 。 近 出 卡 方 。 自由 度 下 显著 性 辛 - 费 德 特 。 ”下 限 


time 0.314 10.110 5 0.07d 0.575 0.754 D0.333 
检 通 " 正 变化 转 摘 居 因 变量 的 误 羡 博 方 芋 筷 阵 与 但 等 利 降 成 比例 "这 一 原 假 设 : 
a. 设计 : 商号 + group 
主体 内 设计 : ime 
b. 可 用 于 调 稚 平均 显著 性 检验 的 自由 度 : 修正 检验 档 显 示 在 “主体 内 效应 检验 * 表 中 - 


主体 内 效应 检验 


削 | 量 MEASURE 1 


油 FF 
me 0 T102605 0000 | 
Bm ms es ee es ee ee en mm a em mn ee wn me me mn em el me en el en en en en wl mn ee nl me en ee en en nl en en en en 电 

格林 豪 斯 - 善 斯 勒 53.731 1.726 31.127 102.605 0.000 

六 意 德 特 53.731 2262 23755 102.605 0.000 

下 限 53.731 1000 53731 102.605 0.000 
time*group 中 设 天 形容 46.706 3 15569 89190 0.000 

格林 豪 斯 - 益 斯 勒 46.706 1726 27057 89.190 0.000 

辛 - 惕 饱 竺 46.706 2262 20649 89.190 0.000 

下 限 46.706 1000 46706 89.190 0.000 
误 甘 ime) ”假设 球形 度 5237 30 0175 

格林 训 斯 - 益 斯 勒 5.237 17.262 0.303 

广 - 帆 饱 竺 5237 22619 0232 

F 限 5.237 10.000 0.524 


10-62 ”球形 度 检 验 与 主体 内 检验 结果 


A 主体 内 对 比 恰 验 
注 量 ， MEASURE 1 
源 time 。 川 灶 平方 和 自由 度 均 方 F 上 显著 性 | 
| time 钱 性 1 53.110 1 53.110 138.1934 0.000 | 
| = 次 1 0001 1 0001 0013l 093 | 
| = 葡 】 0.620 1 0.620 8.5091 0015 | 
me oroup 6 1 46025 119.758 ” 
二 次 0.101 1 0.101 1.517 0.246 
三 实 0.580 1 0.580 7.959 0.018 
误差 time) ”线性 3.843 10 0.384 
二 奖 0.665 10 0.066 
三 奖 0.729 10 0.079 
误 盖 方 盖 的 全 文 等 同性 检验 ” rm 
F 自由 度 1 ”自由 度 2 显著 性 I 
timel 4.323 1 10 | 0064 | 
time2 3.402 1 10 1 0.095 
time3 3.885 1 10 1 007 | 
time4 3.462 1 10 | 0092 I 


检验 "各 个 组 中 的 因 变 量 误差 方差 相等 * 这 一 原 慨 复 ™™™” 
a. 设计: 项 距 + group 
主体 内 设计 : time 


图 10-63 ”趋势 检验 与 方差 齐 性 检验 
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4. 主体 间 效 应 检验 

图 10-64 中 ，F=59.731，P=0.000<0.05， 不 同 组 间 体 重 差 异 有 统计 学 意义 。 但 是 ， 因 
为 前 面 group 与 time 存在 交互 ， 此 处 尽管 group 同和 存在 差别 ， 但 不 能 保证 每 个 时 间 点 两 
组 均 有 差别 。 


主体 间 效 应 检验 
测量 : MEASURE_1 
转换 夺 变 站 : 平均 
源 川 业 平方 和 自由 讼 均 方 F 显著 性 
戴 距 277.922 1 277.922 249.612 0.000 
| group | 66.505 1 66.505 159.731 0.000 
2" 11.134 10 I 


图 10-64 主体 间 比 较 检 验 


5. 主体 内 不 同时 间 点 比较 

图 10-65， 采 用 的 是 LSD 法， 发 现 所 有 的 P<0.05， 说 明 各 时 间 点 间 的 体重 两 两 比较 
均 有 差别 。 同 上 ， 因 为 group 与 time 存在 交互 ， 虽 然 不 同 time 有 差别 ， 并 不 能 代表 每 个 
time 的 group 间 存 在 差别 。 一 句 话 ， 当 group 与 tme 存在 交互 ， 研 究 group 和 time 的 主 
效应 已 经 无 多 大 意义 了 ， 应 该 研究 单独 效应 了 ! 

6. 轮廓 图 

由 轮廓 图 〈 见 图 10-66) 可见 ， 两 组 效应 线 不 平行 ， 存 在 交互 ，B 饲料 有 明显 上 升 趋 
势 ，4 饲料 上 升 趋势 较 弱 。 


记 对 比较 
济 最 : MEASURE 1 


tt 平均 值 善 值 由 

| J) | i :误差 【显著 性 限 MEASURE 1 的 估算 边际 平均 值 
1 1 2 0746 0.136 0000 | -1050 -0.442 

| 3 -1.992 0.176 | 0.0001 -2.383 -1.600 

| 4 | -2721 0240 § 0000! -3.255 -2.187 

下 1 | 0.746 0.136 于 0.000 1 0.442 1.050 

| 3 -1.246 0.137 ; 0.000 -1.551 -0.940 

| 4 I -1.975 0189 | 0000 4 -2397 -1.553 

1 3 1 | 1.992 0176 1 00001 1.600 2.383 group 
| 2 | 1.246” 0.137 | 0.000 | 0.940 1.551 一 A 饲料 
4 | -0729 0114 | O0004 -0983 -0.475 -一 B 饲 料 
| 4 1 | 2.721 0.240 § 0.000 2.187 3.255 

| 2 | 1.975°” 0.189 | 0.000 | 1.553 2.397 

| 3 0729 0114 1 0000! 0.475 0.983 


基于 信和 草 过 际 平 均值 
“平均 值 差 值 的 显 者 性 水 平 为 0.05 。 
b. 多 重 比较 调节 ; 最 低 显著 车 异 法 【相当 于 千 进 行 调整 ) 、 


图 10-65 主体 内 成 对 比较 


3 


] pF 


time 


图 10-66 轮 廊 图 
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7. 简单 效应 分 析 

既然 存在 交互 ， 仅 研究 主 效应 就 不 能 实现 研究 目的 ， 现 在 咀 承 开 始 进行 单独 效应 的 
比较 。 

(1) 简单 效应 比较 。 请 大 家 重新 分 析 一 下 本 例 数据 ， 操 作 步 又 不 变 ， 当 回 到 重复 测 
量 功能 窗口 点 击 “ 确 定 ” 之 前 ， 上 点击“ 粘贴” 按钮 ， 则 会 得 到 刚才 所 有 操作 的 程序 〈 见 
10-67) 。 然 后 修改 成 图 10-68 即 可 。 点 击 菜 单 运 行 一 全 部 ， 主 要 特色 结果 如 图 10-69 
和 图 10-70 所 示 。 


项 “语法 1 -IJBM SPpSS Statistics 语法 编辑 器 


大 "语法 1 - IJBM SpSS Statistics 语法 嵩 辑 器 


EECOEEEETC 
ESLER ETAR 
属国 网 国葬 园 @@ BDRM 


[DATASET ACTIVATE |||1 局 
| DATASET ACTIVATE 溢 所 抹 1. 
LM timel timee time3 timed4 BY goup 
WSFACTOR=time 4 Polynomial 
IMETHOD=SSTYPE(3) 
iPLOT=PROFILEttime"group) 
IEMMEANS=TABLES(group) COMPARE ADJ(LSD) 


DATASET ACTIVATE 数 提 第 11 
GLM timel tmea time3 timed BY group 
MVSFAGTOR=tiMe 4 Polynomial 
METHOD=SSTYPE(3) 
iPLOT=PROFILEtime*group) 
EMMEANS=TABLEStgroup} CONMPARE ADJILSD) 
EMMEANS=TABLEStime) COMPARE 上 DJILSD) 
IEMMEANS=TABLE S(tgrouptime) 
iPRINT=DESCRIPTVE HOMOGENEITY 
IGRITERIA=ALPHAY .05) 
NVYSDESIGN=time 
| ,DESIGN=group| 


iCRITERIA=AL PHA[.05) 
| | "WSDESIGN=time 
14 he /DESIGN=group | 


i ET 同 着 


| BewsPssstatistics 处 理 程序 就 法 | | |Unicode:DNIn 13Col 16| | | 
图 10-67 重 测 原 程序 图 10-68 重 测 修改 后 单独 效应 程序 


(2) 里 独 效 应 结果 。 从 图 10-69 可 见 ，timel 两 组 无 差异 ，tme2、tme3 和 tme4 两 
组 间 均 有 大 寞 ; 从 图 10-70 可 见 ，4 组 各 时 则 点 间 均 无 丢 异 ，B 组 各 时 间 扣 间 均 有 到 天。 


成 对 比较 
测量 : MEASURE 1 


Wyoroup | 沁 标准 误差 


| 1 A 全 料 日 饲料 0.083 0.164 . 

I -0.083 0.164 . -0. 

| A 人 饲料 | 1.092 0.325 .007 0.367 8 

| 3 A 词 料 B 饲 料  ! -3.433 0.393 0.000 1 -4.310 -2.557 
| 8B 饲料 A | 3.433 0.393 © 0.000 | 2.557 4.310 
A 4 4975 0.508 1 0.000 | 3843 6.107 


日 饲料 


* 平均 值 差 值 的 显著 性 水 平 为 0.05 
b. 多 重 比较 调节 : 最 低 显著 差异 法 〔 相 当 于 不 进行 调整 ) ， 


图 10-69 不 同时 点 两 组 效应 比较 


测量 : MEASURE_1 


| 第 10 章 方差 分 析 | 149 


成 对 比较 


mu ws ws ws ws we es 平 坷 值 项 上 
wr wr wy ei- 值 | 


group 各 tme CJ) Wme 


Pe en 人 信 的 39% 守信 区 间 
标准 误 莽 ”上 显著 性 下 限 Th 


| A 1 2 | 
| 3 | 
z | 
| 1 | 
| 
I 3 | 
z 一 | 
| 1 
| | 
| 2 | 
| a | 
| "| 
| 2 | 
| , 
3 | 


-0.150 
-0.233 
-0_192 


-0.075 


0.075 


0.033 
-0.042 


0193 | 0431 | -0.588 0.272 

0249 | 0370 : -0787 0.321 

0339 1 0564 | -0947 0.563 
| | 

0194 1 0707 | -0507 0357 
和 

0.194 | 0707 | -0.357 0.507 
| 

0.268 | 0.903 | -0 .563 0.630 
| 


O161 gm 0.801 -0 .401 0.318 


= =| Be Li 
EE EE EE EE EE EE EE Ey Ey 


= 
GB Ey =| Be 


-3.750 
-5.250" 
1.333 
-2.417 
-3.917 
3.750 
2.417 
-1.500 
5.250 
3.917 
1.500 


I 

I | ; : 

| 1 0 

I 

1 1 ooo0 | 

I | . 

| \ 

1 

1 一 一 一 
I 

I I 

I 

| \ 1 

I 7 0000 (1405 6005 
1 

I 对 


mm 
晤 加 
瑟瑟 
Ey 一 | 
号 


D249 
0339 
0.193 0000 
0.194 
0.268 
D0249 
0.194 


| 4.304 3.196 
| -6.005 4.495 
1 0.903 1.763 
2.849 1.985 
1 -4513 -3.320 
0000 | 3.196 4.304 
0.000 : 1.985 2 849 
0.161 0000 | -1.860 -1.140 
0.339 0.000 4.495 6.005 
0268 0000 | 3.320 4513 
0.161 0000 | 1.140 1.860 


基于 估算 边际 平均 慎 


图 10-70 ”各 组 不 同时 间 点 比较 


案例 实战 四 : 不 等 中 重复 测量 

上 述 研 究 的 重复 测量 , 重复 测量 时 间 点 是 等 间距 的 , 如 果 测 量 时 间 点 间 的 间距 不 等 ， 
不 能 直接 用 上 述 的 方法 分 析 。 在 SPSS 中 需要 简单 编程 实现 。 继 续 以 单 因素 重复 测量 的 
案例 为 例 ， 如 果 时 间 点 改 为 0min、45min、90min 和 180min， 则 为 不 等 距 数 据 ， 按 照 案 
例 实 战 一 的 操作 步骤 操作 ， 在 最 后 确定 之 前 ， 点 击 “ 粘 贴 ”， 得 到 图 10-71。 然 后 将 程序 
改 成 图 10-72， 增 加 框 中 内 容 即 可 。 其 他 解读 与 上 述 相 同 。 


荐 "语法 2 - IBM SPSS Statistics 语法 策 杠 做 


WUSFACTOR=time 4 Polynomial 
METHOD=S3TYPEI[3) 

iPLOT=PROFILE(time) 
EVMIMEANS=TABLESttIme) COMPARE ADJLSD) 
iPRINT=DESCRIPTYE HOMOGENEITY 
IGRITERIA=ALPHALO0S) 


| WwwSDESIGN=time | 


| 1BM SPSS Statistics 巡 理 程序 就 要 | | |Unicode:ONIn 10Col17| | | 


图 10-71 


不 等 中 重复 测量 源 程 序 


| 便 “语法 2 - IBM SpSS Statistics 语法 编 轻 器 


文件 人 编辑 人 查看 数据 {[ 转换 C 分 析 必 直 辆 (4 图 形 (( 实用 程序 运行 { 工具 ({ 扩展 C 窗口 儿 助 上 


千 电 岛国 到 二 国画 此 沽 的 
国 国 A 


DATASET ACTIVATE 
|GLM DATASET ACTIVATE 党 所 后 4 
PLM IN Ta TU 


PLOT=PROFILE(time) 
IEMMEANS=TABLES(time) COMPARE ADJ(LSD) 
/PRINT=DESCRIPTIVE HOMOGENEITY 

|| wcRITERIA=AL PHA 05) 

| ANSDESIGN=time | 


QQ—— 和 池 
图 10-72 ”不 等 距 重 复 测量 修改 后 程序 


150 | SPSS 实战 与 统计 思维 | 


案例 实战 五 : 多 因素 重复 测量 
重复 测量 不 是 只 能 有 2 因素 ， 其 中 一 个 为 重复 测量 ， 还 可 以 有 多 因素 的 重复 测量 。 
如 人 案例: 为 了 研究 饮食 、 活 动 鲍 炼 种 类 与 人 脉 持 的 关系 ， 某 医生 将 18 个 人 随机 分 配 到 饮 
食 结 构 不 同 的 组 ， 且 每 组 成 员 又 被 分 配 至 三 种 体育 锻炼 活动 组 ， 数 据 格 式 如 图 10-73， 试 
进行 统计 分 析 。 


[ | 他 ID | 品 exereisel| Bdiet Fpulsel ?pulsed| Fpulsed| 亚 - 


1 和 

1 1 

1 1 

1 2 

1 2 | 图 
1 15 3 1 88 157 224 『 
16 16 3 3 58 99 131 
Tr 17 3 9 85 132 186 
18 18 3 9 78 110 164 
109 ; 图 


图 10-73 ”数据 视图 


案例 分 析 

本 例 研究 3 个 因素 ,锻炼 因素 、 饮 食 因素 还 有 时 间 因 素 ， 效 应 量 为 脉搏 ， 计 量 资料 ， 
初步 考虑 3 因素 ， 其 中 一 个 因素 为 重复 测量 的 多 因素 方差 分 析 。 

1. 调用 重复 测量 因子 级 别 定义 窗口 

菜单 一 分 析 一 一 般 线性 模型 一 重复 测量 ， 弹 出 图 10-74， 如 图 操作 ， 点 击 “ 确 定 ” 后 
弹出 图 10-75。 


图 10-74 重复 测量 定义 因子 
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2. 重复 测量 功能 窗口 设置 
如 图 10-75， 将 3 次 测量 脉搏 放 入 主体 内 框 ，exercise 和 diet 放 入 主体 间 因 子 。 
3. 参数 按钮 设置 


(1) 点 击 参数 按钮 “图 ”, 将 tme 放 入 水 平 轴 , diet 放 入 单独 线条 , exercise 放 入 单 图 。 
大 家 根据 自己 的 研究 展示 目的 , 不 知道 如 何 操 作 , 可 以 颠倒 做 几 个 , 看 哪个 结果 更 好 展示 。 

(2) 参数 “选项 ”设置 ， 按 图 10-76 中 相应 的 步骤 操作 ， 点 击 “ 继 续 ” 回 到 图 
10-75， 点 击 “ 确 定 ” 运 行 。 


京 测 必 

参 救 估算 值 加 ) 王莽 图 上 蝶 ) 

加 SSCP 矩阵 失 拟 人 L) 

吕 融 闫 SSGP 矩阵 一 役 可 估 因 数 (GE) 


星 著 性 水 平 [) : 置信 区 间 鸭 95.0% 


也 区 [下 Lm | 


图 10-76 重复 测量 : 选项 


结果 解读 

1. 多 变量 检验 结果 

见 图 10-77，time 对 应 的 P<0.05， 不同 时间 扣 脉搏 均 数 差异 有 统计 学 意义 ; 
timexdiet、exercisextime 和 exercisexdietxtime 均 无 交互 ，P>0.05。 

2. 球 对 称 检 验 

由 图 10-79 球 对 称 检验 ， 得 到 P=0.028<0.05， 不 符合 球 对 称 性 ， 如 果 进 行 单 变 量 检 
验 则 要 进行 校正 。 

3. 单 变量 检验 结果 

如 图 10-78, 因为 不 符合 球 对 称 , 因此 看 下 面 的 3 种 校正 结果 , 一 般 优 先 选 择 greenhouse- 
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Geisser 法 。 本 例 Fi,.=703.716，P=0.000<0.05， 不 同时 间 脉 捕 均 数 差 异 有 统计 学 意义 ， 
同样 tmexdiet、exercisextime 和 exercisexdietxtime 均 无 交互 ，P>0.05。 结 3 


验 结果 一 致 。 


多 变量 检验 ” 


蛋 设 自由 度 。 误 闫 自由 度 显 


和 
1 比例 轨 流 0.986 381.665 2.000 11.000 | I 
| 威 尔 克 Lambda 0.014 “381.665b 2.000 11.000 0.000 
雷 特 林 轨 广 69.394 381.665° 2.000 11.000 I 0.000 - 
: 1 罗 伊 最 大 根 69.394 381.665° 2.000 11.000 1 0.000 | 
| tirme * exereise I 比美 轨 广 0.184 0.609 4.000 24.000 0.6860 - 
| 威 尔 吉 Lambda 0.816 0.588° 4.000 22.000 | 0.675 : 
| 1 替 特 林山 流 0.225 0.561 4.000 20.000 1 0.693 | 
| - 罗 伊 最 大 根 0.222 1.329° 2.000 12000 | 0301 
| time * diet 绪 药 轨 访 0.203 1.402! 2.000 11.000 | 0.287 
: I 威 尔 克 Lambda 0.797 1.402° 2.000 11.000 1 0.287 I 
. | 霍 特 林 雪 迹 0.255 1.402° 2.000 11.000 0.287 | 
1 名作 号 大 要 0.255 1.402b 2.000 11.000 下 0.287 
| time™* exercise* diete 此 药 轨 入 0.323 1.154 4.000 24000 1 0.356 | 
| 威 尔 克 Lambda 0.684 1.152° 4.000 22.000 0.359 
I 1 霍 特 林 轨 和 迹 0.453 1.134 4.000 20.000 - 0.369 | 
I 1 罗 佬 遇 大 根 0.432 2.593° 2.000 12.000 1 0116 ! 


a. 证 计 : 项 距 + exercise + diet + exercise * diet 
主 悼 内 估计 


: time 


图 10-77 多 变量 检验 结果 


主体 内 效应 检验 
测量 : MEASURE 1 
池 吊 业 平方 和 自由 度 均 方 F 显 靳 性 
time ,BE 7211 TI 0 
伦 林 亭 斯 -六 斯 划 93972.111 1.352 69512.617 703.716 0.000 1! 
| 卒 - 费 德 特 93972.111 2.000 46986.056 703.716 0.000 | 
1 下 限 93972.111 1.000 93972.111 i03.716 0.000 
time “exercise 。。 _ 候 设 渤 玉 度 P60 
1 格林 剖 斯 -次 斯 勒 80.556 2.704 29.794 0.302 0.804 | 
, 下 - 备 德 特 80.556 4.000 20.139 0.302 0.874 | 
1 下 限 80.556 2.000 40.278 0.302 0.745 
time * diet 假设 球形 度 344926 a __172.463 ___2.583 0.096 
I 格林 训 斯 - 盖 斯 勒 3444926 1.3952 2595.147 2.583 0.120 1 
1 六 - 费 乱 特 344.926 2.000 172.463 2.583 0.096 
| 下 限 344.926 1.000 344.926 2.583 0.134 


time * exercise * djet ”六 训 全 和 入 193 083 1 T0715 
| 格林 可 斯- 盖 斯 勒 ” 493.963 2.704 182.696 1.850 0.182 i 
| 地 -六 他 生 493963 4000 123491 1850 0.152 | 
Wy 493963 2000 246981 1850 0.199 


误 闫 (time) _ 息 设 球形 度 1602.444 24 66.769 
恪 林 认 斯 - 盖 斯 勒 1602.444 16.222 98.779 
卒 - 费 德 特 1602.444 24.000 66.769 
下 限 1 602 444 12， 000 1 33. 3237 


i 10-78 主体 内 检验 结果 


与 多 变量 检 
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莫 奇 来 球形 麻 检 验 ” 
测量 : MEASURE 1 一 本 
| l Epsilon® 
| TEEEETEST 
体内 效应 。” 英 奇 来 W ”近似 卡 方 ”自由 度 1 显著 性 1 勒 节 - 费 德 特 。 ”下限 


time 0.521 7.181 2 | 0.028 | 0.676 1.000 0.500 


检验 " 正 交 化 转换 后 因 变 量 的 误差 协 方 闫 矩阵 与 恒 等 捧 阵 成 比例 "这 一 原 假 设 。 
a. 设计 : WEE + EXeIcCISe + Ulet + exercise * diet 
F 体内 设计 :time 


bh, 可 用 于 调 辊 平均 显著 性 检验 的 自由 度 : 修正 检验 将 显示 在 “主体 内 效应 检验 " 表 中 


图 10-79 ”球形 度 检验 结果 


4. 主体 内 对 比 检验 
前 面 既然 发 现 不 同时 间 点 脉搏 均 数 有 差异 ， 那 么 随 着 时 间 有 什么 变化 趋势 呢 ? 由 图 
10-80 可 知 ，time 存在 线性 和 二 次 的 关系 ， 但 本 例 数据 更 加 支持 呈 线 性 关系 ， 因 为 线性 的 
万 较 大 。 
主体 内 对 比 俊 答 
+ MEASURE 1 bd 


| 1 time 。 川 糯 平方 和 ”自由 度 茹 方 | F 开 痢 性 _ 
| time © 线性 。 93738.028 1 93738.028 | 832.610 10.0001| 
1 一 次 234.083 1 234.083 【 11.171 40.00611 
8 time * pxarcise | 线性 26.056 2 13.028 | 0 .116 0.892 | 
1 一 次 54.500 2 27.250 1 1.300 0.308 
time * diet | 线性 342.250 1 342.250 ! 3.040 0.107 | 
l 1 二 次 2.676 1 2.676 | 0.128 0.727 |! 
lime* exerclse * diet | 线性 478.167 2 239.083 | 2.124 0.162 | 
| z 1 =—x 15.796 2 7.898 ! 0.377 0.694 | 
误差 (time) ”线性 1351.000 12 112.583 
-次 251.444 12 20.954 


图 10-80 ”主体 内 趋势 检验 


5. 方差 齐 性 与 主体 间 效 应 检验 

图 10-81 (A) 方差 齐 性 检验 P 均 大 于 0.05，“ 大 同 小 异 ”， 故 方差 齐 。 图 10-81 
(B) 只 发 现 不 同 饮食 diet，P-=0.013<0.05， 不 同 饮 食 结 构 组 间 脉 搏 存在 差异 ; exercise、 
exercisexdiet 检验 P>0.05， 差 异 无 统计 学 意义 。 

6. 因素 比较 与 轮廓 图 

图 10-82 (A) 为 不 同 diet 组 间 比 较 ，P=0.013<0.05， 组 间 有 差别 ， 图 10-82 (B) 为 
不 同时 间 点 比较 ， 尸 均 小 于 0.05， 差 异 有 统计 学 意义 。 图 10-83 为 3 张 轮廓 图 中 的 一 张 ， 
结合 图 10-82 (A) 结果 ， 可 以 得 出 饮食 1 脉搏 高 于 饮食 2。 
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误差 方差 的 莱 文 等同 性 和 检验” 


F 自由 度 1 ”自由 度 2 
pulse1 1.836 5 12 
pulse2 1.018 5 12 
pulse3 0.499 5 12 


3. 设计 
主体 内 设计 : time 


检验 "各 个 组 中 的 因 变 量 误差 方差 相等 这 一 原 假 议 


: EE + EXEIcisSe + diet + Exercise * diet 


主体 间 效 应 检验 


测量 : MEASURE_1 


转 搞 后 变量 : 平均 
沽 川北 平 方 和 自由 度 均 方 F 显著 性 
哉 距 1014348.167 1 1014348.167 989.697 0.000 
| exercise 1560.333 2 780.167 “0761 0.488 ! 
; diet 8791.130 1 8791.130 8.577 0.013 | 
| exercise >det  _ 1 8.481 | 和 本 本 硬 | 2 9241 0351 __ 0.711 | 
误 著 12298.889 12 1024.907 
图 10-81 方差 齐 性 与 主体 间 效 应 检验 
成 对 比较 
_ 测 最 MEASURE 1 四 四 
平均 值 莽 值 人 | 差 值 的 95% 置信 区 间 " 

路 diet (J) diet J) 标准 误差 1 显著 性 e 下 限 上 限 re 
ee ‘ A 
1 2 15.519 8.713 4 0.013 6.534 44.503 MEASURE 1 的 估算 边际 平均 值 

2 1 -325.519 87131 0013| -44.503 -6.534 按 exercise=1 


wma 
基于 估 筑 边际 平均 值 

*. 平均 值 差 值 的 显著 性 水 平 为 0.05 

b. 多 重 比较 调节 ; 最 低 显 着 差异 法 (相当 于 不 进行 调整 


成 对 比较 


测量 : MEASURE_1 


| 差 什 的 95% 置信 区 间 。 


平均 值 董 值 小 | 
(D) tme (J)time ) 标准 误差 四 显著 性 于。 下限 上 大 
2 -46.611 2.068 | 0.000 | -51118 -42.105 
3 -102.056" 3.537 | 0.000 | -109762 -94.349 
2 1 46.611 2068 | 0000 | 42105 51.118 
3 -55.444 2.339 8 0.000 | -60540 -50.349 
3 1 102.056 3.537 | 0.000 | 94349 109.762 
2 55444 2339 | 0000 | 50349 60640 


基于 估算 边际 平均 值 
* 平均 值 差 值 的 显著 性 水 平 为 0.05 
b. 多 重 比较 调节 : 最 低 显 车 差 寞 法 〔 相 当 于 不 进行 调整 ) 


10-82 ”事后 成 对 比较 


1 2 3 
time 
图 10-83 ”轮廓 图 


位 运 的 是 ， 本 例 分 析 中 ， 因 系 之 间 并 没有 发 生 交互 作用 ， 如 果 存 在 交互 ， 按 照 如 上 
分 析 则 不 太 受 当 ， 应 该 进行 单独 效应 分 析 ， 多 因素 重 测 的 单独 效应 分 析 要 复杂 得 多 ， 如 
果 两 因素 交互 AxB， 则 需要 考虑 单独 效应 〈 也 称 为 简单 效应 ，simple effect) ; 如 果 是 
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AxBxC 二 阶 交 互 ， 则 要 考虑 简单 简单 效应 〈simple simple effect) 。 

经 验 分 享 

1. 多 因素 重复 测量 方差 分 析 ， 结 果 首 先 看 存在 不 存在 交互 ， 夺 无 交互 ， 而 time 的 
P<0.05， 那 么 只 需 考 虑 主 效应 ， 主 效应 组 间 差 异 的 ， 如 果 有 意义 ， 则 各 个 时 间 点 几 组 都 
存在 差异 。 为 什么 呢 ? 因 为 无 交互 ， 即 多 条 线 为 平行 线 ， 平 行 线 上 的 各 时 间 扣 的 不 同 组 
间 比 较 ， 肯 定 有 差异 ; 但 如 果 存 在 交互 ， 则 几 条 线 相互 交织 不 平行 ， 此 时 不 能 根据 主 效 
应 结果 直接 下 结论 ， 需 要 进行 单独 效应 分 析 。 

2. 重复 测量 可 以 采用 多 变量 检验 和 单 变量 检验 ， 多 变量 检验 条 件 宽松 ， 单 变量 检验 
需要 满足 球 对 称 假设 ， 不 满足 时 需要 矫正 。 理 论 上 多 变量 和 单 变量 检验 结果 是 一 致 的 。 
如 果 符 合 球 对 称 ， 则 看 单 变量 分 析 结 果 ; 如 果 不 符 合 球 对 称 ， 则 以 多 变量 结果 为 准 ; 如 
果 校 正 后 的 结果 与 多 变量 不 一 致 ， 以 多 变量 结果 为 准 。 

3. 应 用 条 件 与 注意 事项 : 

(1) 当 各 组 观察 例 数 不 等 时 ， 不 可 用 上 述 重复 测量 数据 方差 分 析 ; 

(2) 观察 例 数 相 等 ， 有 缺失 值 时 ， 不 可 用 上 述 重 复 测量 方法 ; 

(3) 重复 测量 单 变量 分 析 时 ， 应 该 满足 球 对称 检 验 ， 不 满足 应 该 进行 校正 ; 

(4) 单 组 重复 测量 只 有 符合 球 对称 ， 才 可 以 用 随机 区 组 设计 方差 分 析 ; 

(5) 重复 测量 ， 也 可 以 用 多 变量 检验 ， 一 般 多 变量 结果 与 单 变量 结果 是 一 致 的 ; 

(6) 多 因素 重复 时 ， 当 group 与 time 和 存在， 研究 主 效 应 已 经 意义 不 大 ， 应 该 采用 研 
完 单 独 效 应 ; 

(7) 设立 对 照 的 干预 前 后 设计 ， 如 果 差 值 符合 正 态 和 方差 齐 ， 可 以 两 独立 t， 不 符 
合 应 该 重复 测量 。 

到 例 实 成 六 : 两 个 因素 均 是 重复 测量 
前 面 所 述 展 为 单 因素 重复 测量 ， 虽 然 研究 的 因素 可 能 是 多 个 ， 但 重复 测量 因素 只 有 


一 个 ， 然 而 现实 研究 中 ， 肯 定 会 存在 重复 测量 因素 为 多 个 的 情况 ， 此 时 应 该 采用 多 重复 
测量 因素 方差 分 析 。 
案例 实战 


某 研究 者 采用 4 治疗 方案 治疗 患者 ， 检 测 患 者 治疗 后 3 个 不 同时 刻 腓 肠 神 经 和 腓 浅 
伸 感 觉 神 经 传导 速度 的 变化 ， 试 进行 统计 分 析 。 案 例 数据 data10.8.sav。 

案例 解析 

本 例 研究 一 组 患者 ， 研 究 效应 指标 为 神经 传导 速度 变化 ， 但 研究 因素 腓 肠 神经 和 腓 
浅 神经 是 同一 个 人 身上 的 ， 属 于 重复 测量 ; 同时 每 个 神经 还 检测 了 3 个 时 间 点 。 所 以 本 
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例 为 同 组 资料 2 个 重复 测量 设计 ， 一 个 为 不 同 部 位 的 重复 测量 ， 一 个 为 不 同时 间 的 重复 
测量 。 

1. 打开 数据 data10.8.sav, 分 析 一 一 般 线性 模型 一 重复 测量 , 图 10-84。 输入 SJ( 神 经)， 
2 个 水 平 ; 时 间 (time〉，3 个 水 平 ， 添加 入 被 试 内 因子 框 。 


2. 定义 : 点 击 图 10-84“ 定 义 ”， 弹 出 图 10-85 重复 上 度量， 将 6 个 指标 按 顺序 放 入 对 
应 位 置 ， 按 照 图 示 操 作 。 


1 群体 向 艺 变 星 0W) 
' LS timel 


上 | 此 到 1[F0_0 马 
‖| 六 腓 灌 神 地 时 刻 2 [FQ_ 习 
.将 有 目 六 神经 时 齐 3[FQ_3] 


4 = | ne, Ese le Ge 


图 10-84 重复 测量 定义 因子 图 10-85 重复 测量 主 对 话 框 


3. 绘制 : 如 图 10-86 所 示 ， 将 time 放 入 水 平 灿 ，SJ〈 神 经) 放 入 里 图 , 添加 入 作 图 框 ， 
点 击 “继续 ” , 


4. 选项 :， 如 图 10-87 所 示 , 将 SJ、time、SJxtime 放 入 显示 均值 ， 勾 选 “比较 主 效应 ”， 
输出 描述 统计 和 方差 齐 性 ， 点 击 “ 继 续 ”， 


司 计 过 味 均 慎 
回 子 与 固 于 芝 互 下 
IOWERALL) 


六 中 阅 
| 局 方 革 十 性 柱 骆 IH) 4 
Te 


轩 其 典 舍 HI 同 咸 荆 图 IR) 
回 SSCF 写 咱 加 城 于 拒 痛 会 度 往 驻 iL\ 
局 丝 和 SSCP 拓 耳 贺 一 股 估 计 函 歼 i) 


显 圭 性 水 平 人 轩 售 区 间 闭 950 所 
| - 吗 二 3 古 | TI 出 王 站 6 


图 10-86 ”轮廓 图 图 10-87 选项 设置 
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结果 解读 

大 部 分 结果 与 前 面 讲解 的 解读 一 致 ， 此 处 不 更 述 ， 选 主要 结果 解读 ! 

1. 多 变量 检验 结果 : 由 图 10-88， 可 见 SJ、time 和 SJxtime 的 P 均 小 于 0.05。 如 果 
最 后 交互 没有 意义 ， 那 么 前 面 SJ 和 time 的 结果 可 以 直接 看 ， 因 为 SJxtime 存在 交互 ， 因 
此 ， 前 面 的 主 效应 结果 已 经 不 再 重要 ， 或 者 说 不 可 靠 ， 需 要 看 简单 效应 结果 。 


多 变量 检验 ” PE 

_ 效应 车 F 和 慨 设 df 误 盖 几 
SJ Pillai 的 晨 踪 0.606 16.939" 1.000 11.000 
Wilks 的 Lambda 0.394 16.939° 1.000 11.000 

Hotelling 的 黑 踪 1.540 16.939° 1.000 11.000 

Roy 的 最 大 根 1.540 16.939° 1.000 11.000 

time Pillai 的 跟踪 0732 13.691 2000 10.000 
Wilks 的 Lambda 0.268 13.6919 2000 10.000 

Hotelling 的 黑 踪 2.738 13.691° 2000 10.000 

Roy 的 最 大 根 2.738 13.691° 2000 10000 

SJ*time ”Pillai 的 中 踪 0.794 19.257" 2000 10000 
Wilks 的 Lambda 0.206 19.257° 2.000 10.000 

Hotelling 的 黑 踪 3.851 19.257° 2000 10.000 

Roy 的 最 大根 3.851 19.257° 2000 10.000 

3. 设计 : 规 距 


让 体内 设计 : SJ + time + SJ *time 
b. 精确 统计 量 


图 10-88 多 变量 检验 结果 
2. 单 变 量 结果 : 如 图 10-89 所 示 ， 结 果 与 多 变量 一 致 ，3 个 因素 P<0.05。 


主体 内 效应 的 粒 验 

度量 MEASURE 1 

:是 川 型 平方 寻 df 拘 方 F 

SJ 军用 的 球形 府 0.295 1 0.295 16.939 
Greenhouse-Geisser 0.295 1.000 0.295 16.939 
Huynh-Feldt 0.295 1.000 0.295 16.939 
下 限 0.295 1.000 0.295 16.939 

误 甘 (SJ) 军用 的 奸 形 度 0.192 11 0.017 
Greanhouse-Gealsser 0.192 14.000 0.017 
Huynh-Feldt 0.192 11.000 O017 
下 限 0.192 11.000 0017 

time 采用 的 奸 形 度 0.252 2 0.126 25.563 
Greanhouse-Gelsser 0.252 1 .333 0189 25.563 
Huynh-Feldt 0252 1.448 0.1474 25.563 
下 限 0.252 1.000 0.252 25.563 

误 芋 出 me) 采用 的 球形 麻 0.109 22 0.005 
Greenhouse-Gelsser 0.109 14.662 0.007 
Huynh-Feldt 0.109 15.925 0.007 
下 限 0.109 11.000 0.010 

SJ *time 采用 的 球形 麻 D244 2 0122 31.072 
Greenhouse-Gelsser 0D.244 1.439 0.169 31.072 
Huynh-Feldt 0.244 1.597 0.153 31.072 
下 有限 0D.244 1.000 0D.244 31.072 | 

误差 (38Jime) ”军用 的 球形 度 0.086 22 0.004 | 
Greenhouse-Gelsser 0.086 15.833 0.005 
Huynh-Feldt 0.086 17.571 0.005 
下限 0.086 11.000 0.008 


图 10-89 单 变 量 检验 结果 
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3. 简单 效应 分 析 : 重新 分 析 一 过 ， 在 图 10-85 时 ， 不 要 点 击 “ 确 定 ”， 点 击 “ 粘 贴 ”， 
弹出 程序 窗口 ( 见 图 10-90) ， 修 改 为 图 


DATASET AGTIVATE GLM DATASET ACTIVATE 都 担 折 1. 
CLM | | GLMFeC 1Fe 2Fe Fo 1FQ 2F9 3 
二 时 如 下 | MsFACGTOR=S 2 Polynomial time 4 Pohmomial 
MSFACTOR=S 2 Polynarmial time 3 Polymomial | 和 
IMETHOD=SSTYPEI3 一 上 咱 一 
Eee 本 | 二 网 | ,EwwEANs=TABLEstsJ) COMPARE ADJLSD| 
| JEMMEANS ) COMPARE AUILSDI) 
IEMMEANS=TABLESISJ) COMPARE ADJILSD) | ， 
| 有 | | iEMMEANS=TABLESt me} COMPARE ADJILsD) 下 二 rT 
| y IEMMEANS=TABLESIS "time) | JEMM Ss TSGmn La co MPARED mey) pi 
IPRINT=DESCGRIPTIYE HOMOGENEITY "pe Os 
ICRITERIA=ALPHAL OS) 


Ti PHALDS) 
MSDESIGN=SJ time 3JWime. 


MNSDESIGSN=S] tme SJ time. 


> TIBM SPSS Stalistics Processor 就 堵 | | Imngcaar| | | | lBu SPas latiaics Procesanr ti | | [nT En 138| [| 


图 10-90” 双 因素 草 测 程序 图 10-91 双 因 素 重 测 简单 效应 程序 


4. 简单 效应 分 析 主 要 结 末 
重申 一 下 ， 重 测 结果 较 多 ， 绝 大 多 数 解释 前 面 均 已 经 介绍 ， 此 处 讲 重点 ! 

(1) 神经 里 独 效应 ;图 10-92。 缩 未 可 见 在 测量 时 间 点 2 和 时 间 扣 3， 腓 肠 神 经 和 
腓 浅 神经 传导 速度 变化 是 不 一 样 的 ， 哪 个 变化 大 ， 请 看 结果 中 的 统计 描述 指标 即 可 。 


成 对 比较 


苦 分 的 95% 置信 区 间 b 
SJ 均值 车 值 (-J) 标准 误 羡 Siqgb < 限 上 上 限 


time (SJ USJ 

2 0 013 0.022 0.551 -0.034 0.061 
2 
Em 


-0.211 -0.041 
0.041 D0.211 


ED 
”OQ RES 二 0.167 0.376 
i- | 
* 均值 差 值 在 0.05 级 别 上 较 显 著 
b. 对 多 个 比较 的 调整 ; 最 不 显著 差别 〔 相 当 于 未 作 调整 ) 。 


图 10-92 神经 单独 效应 


(2) 时 间 time 的 单独 效应 : 图 10-93 结果 可 见 S 厂 1 时 ， 即 腓 肠 神经 的 三 次 测量 时 
间 点 之 加 两 两 全 部 有 兰 异 ; 然而 SF2 时 ， 即 腓 浅 神经 ，3 次 测量 时 间 点 之 间 均 无 过 开 。 

(3) 轮廓 图 : 图 10-94。 从 轮廓 图 中 也 能 够 看 出 存在 交互 作用 ， 同 时 也 能 大 和 致 反映 
S 广 1 时 的 测量 差异 ，S.F2 时 测量 点 间 无 差异 。 

为 了 能 够 方便 大 家 跟 看 练习 ， 本 例 感 的 商 音 效应 程序 已 所 做 ， 程 序 文 件 名 称 为 : 双 
因素 重复 测量 简单 效应 程序 。 大 家 在 读 题 设计 时 ， 尽 量 采 用 较为 简单 的 设计 ， 对 于 重复 
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测量 如 果 设 计 过 于 复杂 ， 分 析 起 来 还 是 挺 费 事 的 。 本 例 仅 2 个 都 是 重复 ， 如 果 三 个 都 是 
重复 呢 ， 如 果 本 例 再 加 一 个 不 同 的 身体 部 位 ， 又 是 一 个 重复 测量 ， 这 就 变 成 3 个 重复 了 。 
重复 都 是 组 内 因 了 于 ， 此 时 如 果 再 增加 分 组 因素 ， 即 主体 间 因 于， 又 会 增加 分 析 难 度 ， 不 
交互 还 好 ， 二 阶 及 以 上 交互 分 析 就 很 复杂 了 。 

MEASURE 1 的 估算 边际 均值 


成 对 比较 
度量 : MEASURE 1 3.00 让 
Eee = 莽 分 的 959% 短信 区 同 ? 
均 信 着 什 (kJ) 标准 误差 jsig* | TR rR 一 2 
1 1 2 0128 0.027 0.001 0068 0.189 2 90 
3 0.287 0.041 0.000 0.196 0.377 坷 
2 1 -0128 0.027 -0.189 -0068 Ey 
3 0158 0.025 0.000 0103 0.214 Ie 
3 1 -0.287 0.041 -0377 -0.196 2 .80 
2 -0158 0.025 0.000 -0.214 -0.103 阅 
2 1 2 -0011 0015 0491 -0044 0023 二 
3 0002 0.027 0.952 -0058 0.061 把 
2 1 0.011 0.015 0.491 -0.023 0.044 2.70 
3 0.012 0.020 0.542 -0.031 0.056 
3 1 -0.002 0.027 0.952 -0.061 0.058 
2 -0012 0020 0.542 -0056 0031 D 60 
苞 十 上 并 好 同 二 但 
* 均值 差 值 在 0.05 级 别 上 较 显著 ] 2 3 


b. 对 多 个 比较 的 调整 : 最 不 显著 差别 (相当 于 未 作 调 整 】- time 


图 10-94 轮 亡 图 


图 10-93 时间 点 简单 效应 


> 10.5 协 万 差分 析 


科研 过 程 中 ， 实 验 效应 除了 受到 干预 因素 影响 外 ， 还 会 受到 受 试 对 象 所 处 的 环境 的 
影响 ， 对 于 人 而 言 ， 包 括 年 龄 、 性 别 、 心 理 、 环 境 、 社 会 因素 等 。 为 了 消除 非 干 预 因 素 
的 影响 ， 对 于 可 以 控制 的 因素 ， 在 试验 设计 阶段 我 们 第 采取 组 间 均 衡 的 措施 ， 对 于 难以 
控制 的 因素 ， 我 们 常 在 数据 分 析 阶段 ， 采 用 统计 分 析 方 法 进行 控制 ， 如 分 层 分 析 《〈 适 用 
计量 和 计数 资料 ) 、 多 因素 分 析 (适用 计量 和 计数 资料 ) 及 协 方差 分 析 (适用 计量 资料 ) 。 
经 常 有 人 问 我 ， 非 干预 因素 到 底 是 设计 时 控制 好 ， 还 是 数据 分 析 时 控制 好 。 大 家 可 以 这 
样 理解 ， 事先 控制 就 是 避孕 套 ， 事 后 控制 就 是 打 胎 药 ， 目 的 都 是 节育 ， 但 事后 伤害 大 。 

协 方差 分 析 (analysis of covariance，ANCOVA) 是 将 线性 回归 与 方差 分 析 结 合 起 来 ， 
检验 两 组 或 多 组 修正 均 数 间 有 无 差别 的 一 种 统计 分 析 方法 ， 用 于 消除 混杂 因素 对 分 析 指 
标的 影响 。 

协 方差 适用 于 单 因 素 设计 方差 分 析 、 随 机 区 组 设计 方差 分 析 、 拉 丁 方 设计 、 析 因 设 
计 等 方差 分 析 。 只 有 一 个 协 变量 叫做 一 元 协 方差 ， 多 个 协 变量 叫 多 元 协 方差 。 协 方差 分 
析 的 应 用 应 满足 以 下 条 件 : 
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(1) 要 求 各 组 资料 都 来 自 正 态 总 体 ， 且 各 组 的 方差 相等 ; 

(2) 各 组 的 总 体 回 归 系 数 B 相等 ， 且 都 不 等 于 0， 即 平行 性 检验 。 

案例 实战 

两 种 药物 治疗 高 血压 的 疗效 比较 ，30 例 高 血压 患者 随机 分 2 组 ， 每 组 15 例 分 别 接 
受 A 药 物 和 B 药物 治疗 ， 测 得 治疗 前 血压 和 治疗 2 个 月 后 的 血压 ， 数 据 如 图 10-95 所 示 。 
试 分 析 两 种 降 压 药 疗 效 有 无 差异 。 (数据 文件 : data10.9.sav) 


旬 组 别 | 治疗 前 血压 | 治疗 后 血压 | 3 
1 158 145 包 


图 10-95 ”数据 视图 


案例 分 析 

1. 本 例 为 有 对 照 的 前 后 测量 设计 。 此 类 设计 有 多 种 分 析 思 路 ; 

2. 如 果 治 疗 前 两 组 血压 比较 无 差异 ， 可 以 计算 每 组 治疗 前 后 的 差 值 ， 两 组 差 值 若 符 
合 方差 齐 ， 可 以 进行 两 独立 样本 1 检验 ; 

3. 虽然 前 后 测量 只 有 2 次 ， 也 属于 特殊 的 重复 测量 设计 ， 可 以 做 重复 测量 数据 方差 
分 析 ; 

4. 可 以 将 治疗 前 血压 当做 协 变量 ， 如 果 符 合 方差 齐 和 平行 性 检验 ， 做 协 方差 分 析 。 
本 例 就 采用 协 方差 进行 分 析 讲 解 。 

实战 步骤 

1. 调用 方差 分 析 功 能 窗口 

菜单 一 分 析 一 一 般 线性 模型 - 单 变量 ， 弹 出 图 10-96， 如 图 标示 操作 。 

2. 参数 窗口 设置 

(1) “模型 ”: 如 图 10-97， 将 组 别 和 治疗 前 血压 分 别 放 入 右 框 ， 然 后 同时 将 组 别 
和 治疗 前 血压 选中 ， 再 次 放 入 右 框 ， 此 时 会 产生 一 个 如 图 的 交互 项 。 此 步 操作 是 为 了 验 
证 两 者 有 无 交互 ， 即 是 否 平行 ， 点 击 “ 继 续 ”。 
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10-96 单 变量 框 10-97 模型 设置 


(2) “选项 ”设置 : 如 图 10-98， 将 组 别 放 入 右 侧 显示 均值 框 ， 显 示 选 择 “ 描 述 统计 ” 
和 “ 齐 性 检验 ”。 点 击 “ 继 续 ”。“《 注 本 例 不 勾 选 “比较 主 效应 ”， 以 及 不 进行 事后 检验 ， 
是 因为 只 有 2 组 比较 , 无 需 再 次 两 两 比较 ) 。 点击“ 继续 ”, 回 到 主 对 话 框 点 击 “ 确 定 ” 运行。 


吉 信 翁 癌 训 合 (N) : 
LSD (元 ) 


显示 


到 增进 统计 [D) 。_____ 团 亨 住 到 | 
效应 县 估算 人 ) 分 布 -水 平 图 (P) 
实测 宕 (B) 残 苦 图 ( 民 ) 


参 笋 估 章 值 上 加) 失 氛 全 ) 
中 对 比 系 数 撕 阵 避 ) 一 般 可 佑 朱 数 (GE) 


显著 性 水 平 (人 WU) : 105 。_ | 至 信 区 月 为 95.0% 
| ws 


3. 结果 解读 
(1 ) 协 方差 条 件 。 首先 看 方差 齐 性 和 平行 性 检验 结果 , 图 10-99 (A ) 为 方差 齐 性 结果 ， 
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leveneve 方差 齐 性 f=1.189，P=0.285>0.05，“ 大 同 小 异 ”， 方 差 齐 。 图 10-98 (B) 中 标 
示 部 分 为 “组 别 X 治疗 前 血压 ”交互 作用 检验 , F=0.552, P=0.464>0.05, 因此 两 者 无 交互 ， 
或 者 说 符合 平行 性 假定 。 

10-99(B) 中 , 不 同 组 别 的 P=0.375, 说 明 两 种 降 压 药 疗 效 差 异 无 统计 学 意义 。 注意 ， 
这 不 是 最 终结 果 ， 因 为 协 方差 不 是 一 践 而 就 ， 需 要 逐步 选择 模型 的 。 


A | 误 关 方 莽 的 药 文 等 同性 检验 ” 


因 变 量 : 治疗 后 血压 ===- 

F 自由 度 1 自由 度 2 显著 性 

1.189 1 284 0.285 
检验 “各 个 组 中 的 因 变 量 误 闫 方差 相 寺 巡 一 
假设 

a9. 设计 : 截 距 + 组 别 + 治疗 前 血压 + 组 别 

* 治疗 前 血压 
B 主体 间 效 应 检验 
闹 州 类 平方 和 。” 自由 度 志方 F 显著 性 
峰 正 模型 902.314。 3 300.771 3.824 0.022 
硕 距 779.888 1 779.888 9.916 0.004 
组 刚 64.010 1 64.010 0.814 0.375 
治疗 前 血压 350.981 1 350.981 4.463 0.044 
[和 
误差 2044.886 26 78.649 
总 计 570960.000 30 
峰 正 后 总 计 2947.200 29 


a.R 方 =0.306 (调整 后 民 方 =0.226) 


图 10-99 协 方 专 分 析 结 傈 
(2) 改进 分 析 。 刚 才 已 经 发 现 “组 别 与 治疗 前 血压 ”无 交互 作用 ， 因 此 模型 中 就 
不 应 该 放 入 该 交互 项 ， 否 则 多 少 会 对 模型 的 变异 度 分 解 产生 影响 。 重 新 分 析 一 遍 ， 在 图 
10-97 中 ， 将 交互 项 点 中 删除 ， 再 次 分 析 ， 得 到 结果 如 图 10-100 所 示 。 


主体 间 和 效应 人 险 验 

因 变 最 ; 治疗 后 血压 

源 川 糯 平方 和 自由 度 均 方 F 显 着 性 

桥 正 模型 858.868” 2 429.434 5.552 0.010 

页 中 739.459 | 739.459 9.560 0.005 
[由 523057 1 523.057 6763 0.015 | 
87410.335______1__410.335___ 5.305___ .0029 

误差 2088.332 af Ti.346 

总 计 570960.000 30 

桥 正 后 总 计 2947.200 29 


a.R 方 =0.291【 调 整 后 R 方 =0.239 ] 


10-100 调整 后 结果 
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结果 可 见 ， 治 疗 前 血压 对 治疗 后 血压 f=5.305，P=0.029， 说 明治 疗 前 血压 确实 对 治 
疗 后 血压 有 影响 ， 两 组 降 压 药 比 较 f=6.763，P=0.015，“ 大 同 小 异 ”， 两 组 降 压 药 疗 
效 有 差别 ; 结合 两 组 的 均值 ，4 药 降 压 效果 要 好 于 B 药 。 如 果 本 例 不 把 交互 项 删除 ， 则 
会 得 到 两 种 降 压 药 没 有 差别 的 绪论， 大 家 以 后 做 协 方 才 ， 一 定 注意 哦 ! 

经 验 分 享 

影响 研究 效应 指标 的 计数 变量 叫做 因素 ， 计 量 资 料 叫 做 协 变 量 。 当 协 方差 平行 性 检 
验 不 能 通过 时 ， 可 以 采用 线性 回归 模型 进行 分 析 ， 模 型 中 记得 添加 两 者 的 交互 项 。 回 归 
时 交互 项 的 产生 可 以 利用 SPSS 的 计算 〈compute) 功能 实现 。 


字 10.6 ” 交 义 设计 万 差分 析 


统计 学 上 的 随机 ， 除 了 随机 化 抽样 ， 随 机 化 分 组 ， 还 有 随机 顺序 〈 见 图 10-101) 。 
以 2x2 交叉 试验 为 例 ， 受 试 对 象 随机 分 为 2 组 ， 第 一 阶段 2 组 随机 接受 4 处 理 和 处理， 
干预 一 段 时 间 后 检测 ， 检 测 结束 经 过 洗 脱 期 ， 每 组 再 接受 另外 一 种 处 理 ， 这 样 每 组 接受 
处 理 的 先后 顺序 是 随机 的 。 交 又 设计 是 一 种 试验 效率 较 高 的 试验 设计 ， 如 果 此 时 处 理 的 
资料 为 计量 资料 ， 可 以 考虑 交叉 设计 的 方差 分 析 。 


一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 一 1 


图 10-101 交叉 设计 模式 图 
案例 实战 
为 比较 血液 透析 过 程 中 ， 低 分 子 肝素 钙 (A) 与 速 避 凝 (B) 对 凝血 酶 原 时 间 (TT) 
的 影响 ， 选 择 20 例 接受 血液 透析 的 病人 为 研究 对 象 ， 采 取 两 阶段 交叉 设计 ， 试 验 数 据 如 
图 10-102 所 示 ， 试 对 数据 进行 分 析 。 (数据 文件 : data10.10.sav) 
案例 分 析 
本 例 研究 干预 因素 为 药物 ， 分 为 两 个 水 平 〈 低 分 子 肝素 钙 (A) 与 速 避 凝 (B) ) ; 
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效应 指标 凝血 酶 原 时 间 〈TT) 为 计量 资料 ， 采 用 两 阶段 交叉 设计 ， 符 合 两 阶段 交叉 设计 
方差 分 析 设计 。 

实战 步骤 

1. 调用 方差 分 析 功 能 窗口 

菜单 一 分 析 一 一 般 线性 模型 一 单 变量 ， 弹 出 图 10-103， 按 图 设置 变量 。 


图 10-102 ”数据 格式 图 10-103” 单 变量 


2. 参数 窗口 设置 

(1) “模型 ”， 如 图 10-104， 将 三 个 变量 依次 移入 模型 框 ， 构 建 项 选择 主 效 应 。 

(2) “选项 ”， 如 图 10-105， 将 三 个 变量 放 入 显示 均值 框 ， 同 时 选中 “描述 统计 ” 
和 “ 齐 性 检验 ”。 “因为 本 例 只 有 2 组 和 2 个 阶段 ， 因 此 不 必 设 置 两 两 比较 ) ， 点 击 “ 继 
续 ”， 回 到 主 对 话 框 ， 点 击 “ 确 定 ” 运 行 。 


显著 性 水 平 上 : 置信 区 邮 困 95.0% 


z EE 
图 10-104 ”模型 设置 图 10-105 ”选项 设置 
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3. 主要 结果 

主体 间 效 应 显示 ， 图 10-106，drug 和 stage 对 TT 无 影响 ，P 均 大 于 0.05， 而 不 同 个 
人 间 凝 血 酶 原 时 间 差 异 有 统计 学 意义 ，f=3.108，P=0.010<0.05。 注 : 交叉 设计 各 单元 元 
素数 为 1， 故 无 法 计算 方差 齐 性 。 


主体 间 效 应 丛 验 


误 苹 2842.124 19 149.595a 
1 drug ”假设 人 i ”7 遇 1 ”3 和 ”0 
I 误 芋 866.195 18 48.122° I 
: stage 假设 70.756 1 70.756 I 1.470 
| 误 兰 866.195 18 48.122° | 
1.Subject _ 假设 2842.124 19 -1495851 ,3.108 .0.010, 
误 苇 866.195 18 48.122° | 


a. MS(Subject) 
hb，MS( 讽 差 ) 


图 10-106 交叉 分 析 主 要 结果 


> 10.7 拉丁 方 设 计 方 差分 析 


拉丁 方 设计 是 一 种 特殊 类 型 的 3 个 因素 试验 设计 ， 其 各 因素 水 平 数 必须 相同 。 由 于 
拉丁 方 仅 为 3 个 因素 各 水 平 完全 组 合 的 一 部 分 ， 一 般 不 考虑 交互 影响 。 当 某 因素 各 水 平 
的 变量 平均 值 不 相同 时 ， 还 可 用 前 述 的 方法 进行 任意 两 水 平 之 均值 比较 。 下 面 用 实例 演 
示 拉 丁 方 设计 方差 分 析 如 何 实现 。 

案例 实战 

某 研究 者 欲 比较 5 种 防护 服 对 脉搏 数 的 影响 ， 选 用 5 个 受 试 者 ， 在 5 个 不 同 的 日 其 
进行 试验 。 用 拉丁 方 设计 , 在 行 、 列 与 字母 上 分 别 安排 3 个 因素 (日 期 、 受 试 者 、 防护 服 )， 
得 到 如 表 10-2 所 示 的 结果 , 构建 SPSS 数据 库 如 图 10-107, 试 进行 统计 分 析 。( 数 据 文件 : 
datal0.11.sav) 


表 10-2 5 个 日 期 5 个 受 试 者 5 li (次 /分 ) 
日 期 


EE EE 
ny ET ep We 
2 |B| 144 |cC| 192 |D| 132 |E| 1328 |A| 152 | 648 
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交 癸 正 ) 损 辑 臣 ) 坦 看 虑 ] 者 据闻 ) 转换 东芝 析 吕 | 直 东 而) 图 形 (GG) 详 用 在 序 山 护 酸 度 ) 窗口 (WW) 帮助 轴 ) 


呈 四 = 其 向 更 可 所 图 


2 日 期 |? 受 试 者 | 防护 服 | 脉搏 
a 104., 
100., 
144, 
119, z 
113. 


by by 
> 1 


Ialalan aly 


图 10-107 数据 格式 图 10-108 ” 单 变量 


1. 调用 方差 分 析 功 能 窗口 


沫 单 : 分 析 一 一 般 线 性 模型 一 单 变量 , 弹出 图 10-108。 将 脉搏 放 入 因 变 量 框 , 将 日 期 、 
受 试 者 和 防护 服 放 入 固定 因子 。 

2. 参数 窗口 设置 

(1)“ 模 型 ”; 如 图 10-109,， 将 三 个 变量 放 入 右 侧 模型 框 中 ， 选 择 构 建 项 为 主 效应 ， 
点 击 “ 继 续 ”。 

(2) “事后 比较 ”: 如 图 10-110， 将 三 个 因素 放 入 右 侧 事后 检验 框 ， 本 例 选 择 
SNK 法 进行 两 两 比较 。 和 备注: 具体 选择 哪 种 方法 两 两 比较 ， 根 据 目 己 的 研究 目的 确定 ， 
本 例 选择 SNK 法 进行 演示 ， 因 为 SNK 得 到 的 结果 比较 稳健 。 

(3) “选项 ”: 如 图 10-111， 将 三 个 变量 移入 显示 均值 杠 ， 下 耐 义 选 “ 描 述 统 计 ” 
和 “ 齐 性 检验 ”， 点 击 “ 继 续 ”。 回 到 主 对 话 框 点 击 “ 确 定 ” 运 行 。 
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假定 等 方 着 一 一 一 

LSD I snk | 沃 勒 - 邮 弟 (WN) 

邦 草 谷 尼 世 ) 四 | 图 基 右 ) | 江川 类 误 盖 牢 : |100 

断 渤 克 山 图 基 s-bIK) 邓 尼 特 [E) 

理 费 (C) 邓肯 (D) 控制 央 呈 0) : 。 | 语 后 一 个 
RE-GWF 回 ] 玲 嫌 怕 格 GT2UH) 「 昼 圣 

民 -E-G-W-Q 四 | 加布里 培 尔 (El 磺 骏 岂 [2 息 < 接 和 OO) 世 > 控制 I) 


不 假定 等 方差 
过 姆 黑 尼 T2(M) 图 邓 尼 特 T3 国 羡 妈 斯 - 烹 厄 下 区) 国 邓 尼 特 CIU) 


图 10-109 ”模型 设置 10-110 ”多重 比 较 
四 主体 间 效 应 从 验 
 _ 因 变量 脉搏 . | | 
源 川上 类 平方 和 自由 度 均 方 F 显著 性 
收 正 模型 3566.787” 12 297.232 6.732 0.001 
礁 距 347911.226 1 347911.226 T7879.804 0.000 
TT 
| 学 试 者 2837.142 a 709.286 16.065 0.000 
L WR 217622 4 54406，，_1232 ，_ 0348 | 
误 着 529.827 12 44.152 
总 计 352007.840 29 
修正 后 总 计 4096.614 24 


a.R 方 =0.871 (调整 后 R 方 =0.141 ) 


加 比较 主 效应 (O) 
置信 区 间 调 整 (N) : L 
5 st 108.000 
| | I | 
3 51 112720 1 1 | 
2 51 114960 | | 
1 4 51 115560 41 1 
1 Eee 1as6oo | 
回 匡 状 图 民 ) mm mm wm ll 
a 显著 性 0320 1.00 
一 般 可 估 因 数 (G) 将 显示 齐 性 子 集 中 各 个 组 的 平均 值 ， 
基于 实测 平均 值 、 
显著 性 水 平 W) ;|05 ”| 置信 区 间 为 95.0% 误差 项 是 均 方 【误差 ) = 44.152 。 
人 a. 使 用 调和 平均 值 样本 大 小 = 5.000 。 
[取消 | | io 
图 10-111 选项 设置 图 10-112 分析 结果 


主要 结果 解读 
图 10-112 (A) 显示 , 日 期 和 防护 服 均 无 统计 学 差异 ，P>0.05; 受 试 者 间 差 异 ， 
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了 =16.065，P-0.000<0.05， 因 此 不 同 受 试 者 脉搏 存在 差异 ， 不 同日 期 和 防护 服 脉搏 数 无 差异 。 
图 10-112 (B) 对 受 试 者 进行 SNK 法 两 两 比较 ， 发 现 受 试 者 1 自 成 1 组 ， 其 他 4 人 为 1 组。 


> 10.8 散 套 设计 方差 分 析 


散 套 设计 被 称 为 巢 式 设计 (nested design) 、 系 统 分 组 (hierarchal classification〉 设 
计 和 视 设 计 ， 有 些 教科 书 上 称 这 类 资料 为 组 内 又 分 亚 组 的 分 类 资料 。 根 据 因素 数 的 不 同 ， 
能 套 设 计 可 分 为 二 因素 〈 二 级 ) 、 三 因素 (三 级 ) 等 嵌 套 设计 。 

计量 资料 能 套 设计 的 分 析 营 采用 方 兰 分 析 ， 但 在 分 析 中 需 注 意 的 是 分 析 中 的 误差 项 
不 是 固定 的 ， 而 是 在 变化 的 ， 因 为 B 因 素 的 误差 包含 了 A 因 素 的 误差 ， 所 以 分 析 时 需 将 
A 因 素 的 误差 分 解 出 来 。 因 此 ， 藤 套 设 计 的 一 个 缺陷 是 在 统计 分 析 时 不 能 分 析 有 主 族 之 
分 的 因素 之 间 的 交互 作用 。 在 实验 设计 中 ， 挫 套 设 计 第 用 在 研究 因素 只 有 部 分 因素 可 供 
研究 者 控制 的 实验 中 。 

为 了 让 读者 了 解 舱 套 设计 的 特点 ， 分 别 作 出 两 因素 完全 随机 设计 和 两 因素 岁 套 设计 
的 模式 图 〈 见 图 10-113) ， 以 期 读者 掌握 其 设计 原理 。 


(a) 两 因 系 完全 随机 设计 (b) 两 因素 嵌 套 设计 
图 10-113 ”两 因素 完全 随机 设计 与 两 因素 巷 套 设计 模式 图 
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由 上 图 可 见 ， 在 两 因素 完全 随机 设计 试验 设计 中 ，B 因素 的 4 个 水 平 与 4 因素 的 两 
个 水 平 两 两 组 合 ， 共 有 8 个 单元 。 而 在 两 因素 骨 套 设计 中 ，B 因素 的 b, 和 b, 两 个 水 平 仅 
出 现在 ai 水 平 ， 而 b: 和 bs 两 个 水 平 仅 出 现在 a 水 平 ， 即 B 因素 是 骨 套 在 4 因素 之 中 的 。 

因此 藤 套 设计 是 指 在 因素 试验 设计 中 ， 至 少 有 一 个 因素 的 水 平 是 被 局 限 在 另 一 个 因 
素 的 水 平 中 。 例 如 ， 在 研究 中 如 果 B 因素 的 每 个 水 平 仅 出 现在 4 因素 的 一 个 水 平 之 中 ， 
B 因素 就 是 散 套 于 4 因素 的 ， 可 以 写作 (4) 。 在 和 藤 套 设计 中 ， 被 仍 套 因素 (B 因素 ) 
通常 是 指 固定 的 团体 ， 髓 套 设计 的 目的 就 是 为 了 分 离 出 无 关 变 量 (团体 〉 的 效应 ， 以 便 
更 加 精确 地 评估 自 变 量 (4 因素 ) 的 效应 。 

本 闻 重 点 介绍 两 因素 完全 随机 设计 骨 套 设计 和 三 因素 完全 随机 风 套 设计 。 

10.8.1 ”两 因素 租 套 

案例 实战 

验证 甲 、 乙 、 两 三 种 催化 剂 在 不 同 温 度 下 对 某 化 合 物 的 转化 作用 。 由 于 各 催化 剂 所 
要 求 的 温度 范围 不 同 ， 将 众 化 剂 作为 主要 研究 因素 、 温 度 作 为 次 要 研究 因素 ， 采 用 骨 套 
设计 ， 每 个 处 理 重 复 2 次 试验 ， 结 果 如 表 10-3， 数 据 库 构建 如 图 10-114， 试 做 方差 分 析 ， 
数据 文件 data10.12.sav。 


表 10-3 三 种 催化 剂 在 不 同 温度 下 对 某 化 合 物 的 转化 作用 


催化 剂 温度 


| 
to io Tw | IT 


EE 
转化 率 ( % ) . 


本 例 研究 2 个 因素 众 化 剂 “ 甲 、 乙 、 丙 〉3 水 平 ， 温 度 9 水平， 但 温度 仍 套 于 从 
化 剂 因素 之 下 ， 效 应 量 为 转化 率 ， 计 量 资料 。 注 意 不 要 一 看 到 率 就 认为 是 计数 资料 ! 要 
看 研究 单位 ， 本 例 每 个 研究 单位 获得 的 是 率 ， 而 不 是 贡献 0/11， 如 果 是 后 者 ， 则 为 计数 次 
料 了 。 本 例 符合 2 因 系 柳 套 设计 方差 分 析 。 

实战 步 又 

1. 调用 方差 分 析 功 能 窗口 

菜单 : 分 析 一 一 般 线性 模型 一 单 变量 ， 弹 出 图 10-115， 将 转化 率 放 入 因 变 量 框 ， 将 
催化 剂 和 温度 放 入 固定 因子 。 
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皮 二 国 素 谍 奉 设计 .sav [ 粕 据 集 5] - IBM SPSS Stati.. EE 
训 忻 编辑 | 查看 数据 | 转换 分 析 , 直销 | 图 形 | 实用 程 | 扩展 窗口 { 帮助 


1 
1 | 70 | 84 
1 | 80 | 9 
1 


80 88 
90 ”85 


图 10-114 数据 构建 格式 图 10-115 单 变量 功能 窗口 
2. 参数 窗口 设置 
(1) “模型 ”， 如 图 10-116， 将 催化 剂 和 温度 放 入 模型 框 ， 构 建 项 选择 “ 主 效 应 ”。 
(2) “选项 ”， 如 图 10-117, 将 催化 剂 和 温度 放 入 显示 均值 框 中 ， 并 勾 选 其 中 的 “ 描 
述 统 计 ”， 因 风 套 设计 非 完 全 随机 分 组 ， 因 此 不 做 齐 性 检验 。 


内 | 单 变量 : 选项 


估算 边际 平均 什 
因子 对 因子 交互 (E) : 


比较 主 效应 人) 
置信 人 区间 调 整 (N): 
LSD (和 天) 


显示 

描述 统计 (D) 齐 性 检验 (H) 
效应 量 估算 候 ) 分 布 -水 平 图 {P) 
实测 肚 虽 ) 葡 莽 图 I) 

参 效 估 章 值 思 ) 失 拟人 L) 

对 比 条 数 和 矩阵 人 ) 一 般 可 估 国 数 (G) 


星团 性 水 平 (AD : .05 | 置信 区 间 淹 95.0 吧 
由 平方 和 fo 转 在 模型 中 包括 武 距 仙 二 


图 10-116 模型 设置 图 10-117 选项 设置 


3. 程序 编辑 
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在 主 对 话 杠 中， 点 击 粘贴 按钮 ， 将 目前 所 做 的 操作 的 程序 粘贴 出 来 ， 如 图 10-118， 
将 程序 中 的 最 后 一 行 “/DESIGN= 催化 剂 温度 .” 修 改 为 以 下 代码 ， 如 图 10-119 所 示 : 


“/DESIGN= 众 化 剂 温度 (催化剂) 
/TEST= 催 化 剂 Vs 温度 〈 催 化 剂 ) .” 


午 “语法 1 - IBM SPSS Statistics 语法 编 驾 器 
文件 ( 编辑 (| 查看 ( 数据 (| 转换 ( 分 析 ( 直销 (| 图 形 ( 实用 程 片 运行 人 工具 ( 扩展 ( 窗口 ( 帮助 


DATASET ACTIVATE 
UNIANOVA DATASET ACTIVATE 数据 集 6. 
UNIANOVA 转悠 它 BY 催化 剂 温度 

/METHOD=SSTYPE(3) 
INTERCEPT=INCLUDE 
JEMMEANS=TABLES( 催 化 剂 ) 
JEMMEANS=TABLES( 温 度 ) 
/PRINT=DESCRIPTIVE 
ICRITERIA=ALPHA( 05) 
/DESIGN= 俊 化 剂 温度 | 


六 "证 法 1 - IJBM SPpS5S Statistics 语法 和 编辑 器 


IMETHOD= =SSTYPE(3) 
/INTERCEPT=INCGCLUDE 
IEMMEANS=TABLES( 僵 化 简 》 
[EMMEANS=TABLES( 温 度 ) 
IPRINT: a 
I!CRITERIA=ALPHAI 


| or 


tc unicode ON IOCo | | || | ps ce Nn | | 
图 10-118 骨 套 程序 编辑 窗口 图 10-119 ”修改 后 程序 


如 图 10-119 所 示 ， 其 中 的 括号 为 英文 状态 下 的 括号 。 修 改 完 毕 点 击 菜单 运行 一 全 部 ， 
进行 计算 。 修 改 后 程序 见 提供 的 数据 文件 。 

4. 主要 结果 解释 

本 例 分 析 主 要 方差 分 析 结 果 如 图 10-120 和 图 10-121 所 示 。 需 要 注意 的 是 ， 图 
10-120 中 只 能 反映 同一 催化 剂 不 同 温度 之 间 的 影响 是 否 有 差异 ， 此 例 二 12.152， 
P=0.001<0.05, 因此 拒绝 五 , 接受 到 ,可 以 认为 同一 催化 剂 不 同 温度 间 差 异 有 统计 学 意义 。 
中 10-121 为 不 同 催化 剂 是 否 有 作用 的 比较 结果 ， 可 见 f=14.633，P=0.005<0.05， 因 此 拒 
绝 所 ， 接 受 及 ， 可 以 认为 不 同 催化剂 对 转化 率 有 影响 。 


主体 间 效 应 检验 

_ 因 变量 。 转化 率 

源 中 类 平方 和 目 由 度 均 方 F 显著 性 
”修正 模型 2357.000a 8 294.625 53.568 0.000 
” 截 距 99904.500 1 99904.500 18164.455 0.000 
| 仿佛 556000 2 000 1736 0000 | 
LE A ES 

误 莽 49.500 9 5.500 

总 计 102311.000 18 

修正 后 总 计 2406.500 17 


3a.R 方 =0979 ( 调 必 后 尽 方 =U0.961 ) 


图 10-120 ”二 因 妹 舱 套 设计 方差 分 析 结 果 (1) 
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险 验 络 叮 
_ 因 变量 : 转化 率 z z 
本 平方 和 自由 度 均 方 F 显著 性 
EO 
1 对比 1956.000 2 978.000 14633 0.005 | 
-一 401.000 6 66.933 


图 10-121 ”二 因素 肉 套 设计 方差 分 析 结 果 (2) 


5. 知识 补充 
如 果 要 知道 催化 剂 和 温度 如 何 影响 转化 率 ， 可 以 在 分 析 时 进行 两 两 比较 设置 ， 为 节 
约 篇 幅 ， 此 处 不 敬 。 


10.8.2 ”三 因素 艇 套 


有 时 研究 者 可 能 会 遇 到 更 加 复杂 的 内 套 关系 ， 如 研究 中 可 能 有 上 、 下 两 级 团体 因素 
对 因 变 量 产 生 影 响 ， 如 医院 与 病房 、 学 校 与 班级 、 工 三 与 车 间 ， 在 这 样 的 研究 中 ， 不 仅 
下 一 级 团体 中 的 受 试 对 象 不 能 做 随机 分 配 ， 而 且 下 一 级 团体 在 上 一 级 团体 中 也 不 能 随机 
分 配 。 此 时 就 要 做 更 加 复杂 的 内 套 设计 ， 当 髓 套 的 因素 大 于 等 于 3 时， 通常 就 称 为 m 级 
敬 套 ， 为 了 方便 阐述 ， 本 小 节 主 要 讲解 三 因素 骨 套 设计 。 髓 套 设计 的 因素 超过 3 个 及 其 
以 上 时 ， 就 叫做 m 级 砍 套 设计 ， 随 着 榜 套 级 别 的 增加 ， 分 析 也 愈加 复杂 。 

我 们 以 一 个 案例 为 例 , 曾 明 三 因素 艇 套 设计 。 如 要 检验 一 种 新 药 (4 因素 ) 的 治疗 效果 ， 
研究 者 将 治疗 同一 病 的 两 种 药物 : 新 药 与 旧 药 , 随机 分 给 4 家 医院 (了 3 因素 ) 的 8 个 病房 (CC 
因素 ) 的 Y 个 病人 ， 为 了 研究 医院 和 病房 效应 ， 研 究 者 设计 了 一 个 三 因素 和 能 套 设计 ， 将 
医院 能 套 于 两 种 药 (B (4) ) 中 ， 病 房 骨 套 于 4 家 医院 〈C (B) ) 中 ， 然 后 再 能 套 在 两 
种 药 〈C (4B) ) 中 ， 结 构 参 见 图 10-122。 

模式 图 中 可 见 ， 在 一 个 三 因素 完全 随机 符 套 设计 的 试验 设计 中 ， 刀 因素 的 记 和 忆 两 
个 水 平 仅 出 现在 a 水 平 ，5; 和 bs 两 个 水 平 仅 出 现在 a, 水 平 ， 这 时 B 因素 是 藤 套 在 4 
素 之 中 。 同 时 C 因素 的 c,、c, 两 个 水 平 仅 出 现在 b, 水 平 中 ，c; 和 cs 两 个 水 平 仅 出 现在 
b, 水 平 中 ，cs 和 cs 两 个 水 平 仅 出 现在 bs 水 平 ，cy 和 cs 两 个 水 平 仅 出 现在 b 水 平 ， 表明 
C 因素 是 藤 套 在 B 因素 之 中 ， 而 B 因素 又 岁 套 在 4 因素 之 中 。 
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ey Lie 59 | | 一 | | ss Lm ‘a De | Eh 一 ， 一 | 

一 一 | 二 | | el| a | el ] el | 加 a a Fe 
可 eq mn 二 un _ ~ eo oh 名 Ee 3 加 到 al 
nnn nnlniln|niln| won 


要 素 舱 和 套 设 计 模式 


基本 分 析 方 法 是 首先 将 B 因素 的 4 个 水 平 随 机 分 入 4 因素 的 两 个 水 平 ， 即 随机 分 配 
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bp, 和 5b, 两 个 高 一 级 团体 接受 a) 水 平 处 理 ，b; 和 bs 两 个 高 一 级 团体 接受 a, 水平 处 理 。 这 
时 C 因素 的 8 个 水 平 也 随 之 分 入 两 个 实验 处 理 ， 即 c,/、c,、c; 和 cs 四 个 低 一 级 团体 接受 
ai 水 平 处 理 ，c;、ce、cj 和 cs 四 个 低 一 级 团体 接受 a, 水 平 处 理 。 每 个 低 一 级 团体 内 的 受 
试 对 象 不 再 做 随机 分 配 。 模 型 中 可 见 ，4B、4C、BC 和 .4BC 交 互 作 用 在 三 因素 嵌 套 设计 
中 是 不 出 现 的 ， 这 是 上 藤 套 设计 的 前 提 条 件 。 

案例 实战 

为 了 研究 两 种 教学 方法 的 效果 ， 某 研究 者 随机 选取 4 个 学 校 ， 每 个 学 校 选取 2 个 班 
级 ， 随 机 分 配 了 2 个 学 校 的 4 个 班级 接受 第 一 种 教学 方法 (a1 〉， 分 配 男 外 两 个 学 校 的 4 
个 班级 接受 第 二 种 教学 方法 (a,) ， 研究 中 有 “学 校 ” 和 “班级 ”两 个 舱 套 变量 ,，“ 班 级 ” 
有 8 个 水 平 藤 套 在 4 个 “学 校 ” 中 ，“ 学 校 ” 又 风 套 在 两 种 “教学 方法 ”中 ， 数 据 见 表 
10-4， 数 据 库 见 图 10-123。 试 做 方差 分 机。 数据 文件 data10.13.sav。 


一 一 一 一 一 一 一 一 


1 1 1 3| 国 而 2 3 5 8 
1 | 1 6| 18 2 3 5 9 
1 1 1 4 天 末 2 3 5 8 
1 1 1 3| 20 2 3 5 7 
1 1 2 4 项 区 2 3 6 5 
1 1 2 5 2 2 3 6 7 
1 1 2 3 大 瑟 2 3 6 5 
1 1 2 3| 24 2 3 6 2 
1 2 3 4| 25 2 4 7 9 
1 2 3 | 26 2 4 7 8 
1 2 3 27 2 4 7 8 
1 2 3 |- 2 2 4 7 7 
1 2 4 | 29 2 4 8 12 
1 2 4 30 2 4 8 13 
1 2 4 | 31 2 4 8 12 
1 2 4 6| 32 | 2 4 8 11 


图 10-123 三 因素 典 套 数据 结构 
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1. 单 变量 调用 
菜单 : 分 析 一 一 般 线 性 模型 一 单 变量 , 如 图 10-124 所 示 , 将 成 绩 放 入 “ 因 变 量 ” 选 框 。 


将 因素 教学 方法 、 学 校 和 班级 选 入 “固定 因 了 于 ” 框 。 


图 10-124 单 变 量 设置 


2. 参数 设置 
(1) “模型 ”， 如 图 10-125， 将 3 个 变量 放 入 “模型 ” 杠 ， 如 图 操作 。 
(2) “选项 ”， 如 图 10-126， 将 3 个 变量 放 入 显示 均值 ， 同 时 色 选 “描述 统计 ”， 


扩 击 “继续 ”。 


置信 芭 问 ij 凋 整 岂 ) : 
LSD 党) 


| 齐 性 村 难 it) 
Ee 分 布 -水 平 图 (EF) 
同 右 介 图 (RE) 
和 朱 拟 凡 L) 
一 般 可 居 国 数 (G) 


显著 性 水 平 W) : [05 | 置信 区 间 汐 95.0% 


图 10-125 ”模型 设置 图 10-126 ”选项 设置 
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(3) 主 对 话 框 ， 上 点击 “外 贴 ”， 得 到 操作 的 程序 ， 如 几 10-127 所 示 。 将 程序 中 的 
最 后 一 行 “/DESIGN= 教学 方法 学 校 班级 .” 修 改 为 : 

“/DESIGN- 教 学 方法 学 校 (教学 方法 ) 班级 (学校 (教学 方法 ) ) .” 

注意 其 中 的 括号 为 英文 状态 下 的 括号 。 

因为 包含 风 套 因 系 ,班级 (和 学校 (教学 方法 ) ) 的 作用 FF 应 该 用 班级 的 均 方 天 与 
组 内 均 方 关 相 除 ， 学 校 〈 教 学 方法 ) 的 作用 不 应 该 用 学 校 与 班级 的 均 方 关 相 除 ; 教 
学 方法 的 作用 环 应 该 是 教学 方法 的 均 方 差 除 以 学 校 的 均 方 关 ， 因 此 在 程序 窗口 添加 两 
行 命令 : 


“/TEST= 教学 方法 VS 学 校 (教学 方法 ) 
/TEST= 学 校 (教学 方法 ) Vs 班级 (学 校 (教学 方法 ) ) . 


最 终 如 图 10-128 所 示 ， 修 改 完 华 氮 击 沫 单 运行 一 全 部 ， 运 行程 序 。 


内 "语法 2 - IBM SPSS Statistics 语法 策 往 医 [mm 曙 "语法 2 - ]BM SPSS Statistics 语法 慷 驾 器 te 
况 忻 人 编辑 全 查看 如 数据 在 转换 疮 析 t 直销 Wf 图 形 在 实用 程序 送行 在 工具 如 扩展 由 窗口 名 帮 助 习 文件 正 . 编辑 下- 查看 忆 数据 中 转换 代 分 析 他 直销 岂 图 形 (@ 实用 程序 必 奸 行 攻 工具 GB 扩展 亿 ， 窗口 (WY 


ECTYTE EE 己 HS 四 二 汪 直 的 >@ 
阁 首 网 加 号 因 @@ 本 @ 曙 1 | 国力 放 2 人 /用 有 Ws 


DATASET ACTIVATE DATASET ACTIVATE UNIANOVA 成 缚 BY 办 学 方法 学 校 班级 

UNIANDYA DATASET ACTIVATE 数据 华 7. UNLANOVA 日 | /METHOD=SSTYPEI(3) 

UNIANOWVA 成 缚 BY 热学 方法 学 校 班 妇 站 IINTERCEPT=INCLUDE 
IMETHOD=SSTYPE(3) 人 EMMEANS=TABLES{( 孝 学 方法 ) 
INTERCEPT=INCLJDE IEMMEANS=TABLES( 学 校 ) 
/EMMEANS=TABLES 届 学 方法 ) IEMMEANS=TABLESE 级 ) 
/IEMMEANS=TABLES 倍 校 ) PRINT=DESCRIPTIVE 
EMMEANS=TABLES(H 疡 】 a BHALUNS), = 
/PRINT=DESCRIPTIVE ' /DESIGN= 教 学 方法 学 校 数 学 方法 ) i 

[| ERITERIA=ALPHAM.05) N11 [TEST= 赂 学 方法 VS 学 榨 册 学 方法 

| /DESIGN= 考 字 方 去 字 校 班级 | - 1 枉 国 中 TEST= 学 校 颌 学 方法 ) VS 秆 坟 任 柳 崔 尝 廊 法 让 


~ -GD 上 Lo ha 一 


ss 


| i SFSS Slalslcs 公理 往 序 于 下 同上 ETE CN In 11 i | = lIBM SPSS Sblstcs 外 本 各 序 可 区 | | Unicode:ONlIn 12Col1| | | 


图 10-127 ”三 因素 和睦 套 程序 窗口 图 10-128 ”改变 后 的 程序 


3. 主要 结果 

主要 分 析 结 果 如 下 ， 图 10-129 中 只 反映 在 不 同班 级 的 成 绩 送 并 有 统计 学 意义 ， 
f=9.80，P=0.000<0.05。 图 10-130 (A) 中 反映 不 同 教学 方法 学 生 的 成 颖 看 和 卉 无 统计 字音 
义 ,， F=3.905，P=0.187>0.05。 图 10-130(B) 中 反映 不 同学 校 学 生成 绩 差 异 无 统计 学 意义 
F=1.882,P=0.265>0.05。 

4. 结果 解释 

统计 结果 : 不 同 教 学 方法 差异 无 统计 学 意义 ，f=3.905，P=0.187; 同一 教学 方法 不 
同学 校 之 间 差 异 无 统计 学 意义 ，F=1.882，P=0.265; 不 同班 级 之 间 差 异 有 统计 学 意义 
F=9.80，P-0.000。 

专业 结论: 教学 方法 和 和 学 校对 学 生成 绩 无 影响 ， 班 级 因 系 对 学 生成 绩 有 影 啊 。 
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定制 假设 检验 1 
[| 检验 结果 
因 变 量 成 缚 
主体 间 效 应 检验 源 平方 和 ”” 上 自由 度 ” 均 访 F 囊 村 全 
| 
= ee 1 对 上 比 112.500 1 112.500 3.905 0.187 
因 晤 妥 二 7 
源 币 基 平方 和 ”自由 度 均 广 F 显著 性 一 一 
“0 9. 学 校 (教学 方法 ) 
修正 模型 231.375 1 33.054 21.154 0.000 
就 距 1275.125 1 1275.125 816.080 0.000 
I™™== ee mm mm en ws ws es en en es es en en | mu wn ws en sw ws es es ss es ; 下 动 
1 邦和 方法 112.500 1 112.500 12.000 0.000 ! 定制 假设 检验 
2 


总 计 1544.000 32 [HE S76 2803 682 0265 | 
峰 正 后 总 计 268.875 31 误差 ” ”61.250 4 15.313 
a.R 方 =0.861 (调整 后 RR 方 =0.820) 9. 班 语 (手术 (数学 帮 法)) 


图 10-129 ”不 同班 级 教学 效果 比较 图 10-130 不同 教 学 方法 教学 效果 比较 


> 10.9 正 交 设计 方差 分 析 


前 面 研究 的 单 因 素 方差 分 析 只 能 研究 一 个 处 理 因 素 ， 随 机 区 组 可 以 研究 两 个 研究 因 
素 ， 析 因 设 计 可 以 研究 多 个 因素 并 考虑 交互 作用 ， 但 设计 为 各 因素 各 水 平 的 全 面 组 合 ， 
很 浪费 样本 及 实验 资源 ， 所 以 析 因 设计 一 般 研究 因素 不 超过 三 个 ; 当 研 究 因 素 过 多 时 ， 
如 何 进行 高 效 研 究 ， 一 直 是 个 问题 。 

正 交 设计 是 日 本 学 者 田口 辫 一 ， 在 研制 线性 弹 得 继电器 时 ， 发 明 的 一 种 高 效 优化 试 
验 设 计 方 案 的 一 种 设计 方法 。 当 时 研制 线性 弹簧 继电器 有 几 十 个 特性 值 和 两 千 多 个 试验 
因素 ， 经 过 7 年 研制 成 功 ， 其 性 能 比美 国 同一 产品 更 优 。 虽 然 成 本 仅 几 美元 ， 但 研究 费 
用 用 了 几 百 万 美元 ， 创 造 的 经 济 效益 高 达 几 十 亿美 元 ， 同 时 击 垮 了 美国 的 企业 。 

正 交 设计 法 使 用 一 种 规范 化 的 表格 〈 正 交 表 ) 进行 试验 设计 ， 可 以 用 较 少 的 试验 次 
数 ， 取 得 较为 准确 、 可 靠 的 优选 结论 。 正 交 设 计 可 以 确定 各 因素 对 试验 指标 的 影响 规律 ， 
得 知 哪些 因素 的 影响 是 主要 的 ， 哪 些 是 次 要 的 ， 哪 些 因 素 间 存在 相互 影响 ; 同时 可 以 选 
出 各 因素 的 一 个 水 平 组 合 来 确定 最 佳 生产 条 件 。 

正 交 设计 在 进行 试验 之 前 ， 需 要 根据 自己 研究 因素 的 个 数 和 水 平 ， 选 直 
表 和 正 交 交互 作用 表 进 行 安排 试验 ， 获 取 试 验 数 据 。 

正 交 表 简 记 为 符号 : 忆 (om ) 

其 中 工 一 一 表示 正 交 表 。 

1 一 一 表示 实验 方案 的 个 数 〈 表 的 行 数 ) 。 

1 一 一 表示 试验 因素 的 水 平 数 。〈 水 平 指 试验 因素 在 试验 中 所 选取 的 具体 状态 。) 


相应 的 正 交 
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大 一 一 表示 最 多 可 安排 试验 因素 的 数目 〈 表 的 列 数 ) 。 (试验 因 系 是 对 试验 结果 可 能 
会 产生 影响 的 原因 ， 是 实验 过 程 中 的 上 自 变 量 ， 或 称 条 件 变量 ， 是 输入 参数 。 ) 

常见 的 正 交 表 为 : 

(1) 处 理 因 素 相 同 水 平 的 正 交 试验 设计 

Te ss Bs Del) Des Lo J 

三 水 平 正 交 表 : 了 BG)、 蕊 GG))、G )… 

四 水 平 正 交 表 : LL(4)、Lo(4 ) 、 忆 5(4 )… 

五 水 平 正 交 表 : ,5°)、L,,(3)、L6(5™)*… 

(2) 处 理 因素 不 同 水 平 的 正 交 试验 设计 

正 交 表 中 不 同 因素 的 水 平 数 不 同 称 为 混合 型 正 交 表 。 

常见 的 水 平 数 相同 的 正 交 表 有 : Ls (4x2°) ,Li, (3x2’*) ,Li (6Xx2°) ,Ls (4°x2 ) ， 
Ee CRD YY Te CoD 9 Le Tn 

正 交 设计 内 容 繁 多 ， 其 设计 的 重要 性 远 高 于 统计 分 析 ， 有 专著 专门 前述 ， 本 书 不 会 
详尽 解读 ， 但 为 了 保证 全 书 统 计 分 析 方 法 的 完整 性 ， 本 节 仅 举 一 例 进行 解读 。 正 交 试 验 
设计 的 数据 分 析 主 要 包括 : 直观 分 析 、 极 差分 析 、 方 差分 析 和 回归 分 析 。 

案例 实战 

中 药 黄 芬 有 效 成 分 黄 芬 背 具 有 抑 菌 、 利 尿 、 抗 炎 、 抗 变态 及 解 痉 作 用 ， 并 且 具 有 较 
强 的 抗 癌 反 应 等 生理 效能 。 某 研究 组 采用 正 交 设计 方法 ， 以 期 发 现 黄 芬 昔 的 最 佳 提取 工 
艺 ， 根 据 预 试 结果 ， 拟 定 4 种 因素 ， 即 裔 准时 间 (A) 、 厦 者 次数 (BE) 、 用 水 倍数 〈C) 
及 浸泡 时 间 (D) ， 每 种 因素 选择 2 种 水 平 ， 以 制剂 中 黄 苓 芽 为 考察 指标 。 数 据 文 件 : 
datal0.14.sav。 


表 10-5 因素 与 水 平 设置 
素 


B ( 前 意 次 数 ) C ( 用 水 倍数 ) D ( 浸泡 时 间 ) 


案例 分 析 

这 是 一 个 典型 的 正 交 设计 , 考虑 了 4 个 因素 , 每 个 因素 2 个 水 平 , 因此 可 以 选择 Ls (2 ) 
正 交 设计 进行 安排 试验 。 如 果 要 考虑 因素 之 间 交 互 作 用 ， 还 要 找到 Ze 〈2 ) 正 交 表 的 交 
互 作用 安排 表 ， 安 排 好 研究 因素 后 ， 即 可 进行 试验 获取 研究 数据 ， 见 表 10-6。 
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表 10-6 ”实验 方案 及 结果 


ET EC EE EE ET ET EE 
| | 0 | ss [27s | 35 | sm | 3m | 
sm [os | 093 | os | om7 | os0 | oss | 


案例 实战 

选用 L。(2”) 正 交 表 ， 安 排 4 个 因素 ，2 个 水 平 ， 共 8 次 实验 ， 获 得 数据 如 下 。 

1. 直观 分 析 法 

顾名思义 ， 按 照 实 验 结果 直观 的 判断 各 因素 的 最 佳 组 合 ， 本 例 可 见 第 3 行 试验 的 黄 
芬 苷 产量 最 高 ， 因 此 最 佳 配 伍 为 4,B,C2PD，。 

2. 极 差 分 析 法 

先 解释 一 下 KK,，K, 和 及 的 含义 。 以 4 因素 的 为 例 : 

4 因素 KK 为 4 因素 所 有 取水 平 1 的 黄 芬 苷 提取 量 之 和 除 以 水 平 1 的 个 数 = 

K,= (3.36+4.02+6.14+4.16) /4=4.42 

K.= (2.74+1.47+2.02+1.38) /4=1.903 

R= K-K,-2.517( 注 此 步 用 大 的 减 去 小 的 》 

极 差 越 大 ， 说 明 此 因素 越 重要 ， 因 此 上 述 因素 的 重要 性 排序 为 4CDB。 因 此 结合 
观 法 结果 ， 试 验 最 优 方案 为 41C,D1B,。 

9. 站 在 人 外相 潜 

检验 各 列 对 试验 指标 的 影响 是 否 显 著 ， 在 什么 水 平 上 显著 。 有 了 各 列 的 显著 性 检验 
之 后 ,最 后 应 将 影响 不 显著 的 交互 作用 列 与 原来 的 “误差 列 ” 合 并 起 来 ,组 成 新 的 “误差 列 ”， 
重新 检验 各 列 的 显著 性 。 

(1) 调用 方差 分 析 : 菜单 一 分 析 一 一 般 线 性 模型 一 单 变量 。 如 图 10-131， 将 黄 芬 苷 
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量 放 入 因 变 量 ，4、B、C 和 DD 因素 放 入 固定 因子 。 
(2) “模型 ”参数 设置 : 如 图 10-132， 选 择 定制 ， 将 4 个 因素 放 入 模型 框 ， 选 择 构 
建 项 “ 主 效应 ”， 点 击 “ 继 续 ”。 


图 10-131 单 变量 主 对 话 框 设 置 
(3) 主要 结果 


主体 间 效 应 检验 


因 变量 : 黄 荟 革 最 
路 川 业 平方 和 ”自由 度 均 方 F 显著 性 


修正 模型 16.275a 4 4069 6475 0078 
PE [EE Ef- PAP 
| A 12.676 1 12676 20172 0.021 | 
| 日 0.557 1 0.557 0886 0.416 | 
lc 1.739 1 1.739 2768 0.195 1 
0 -- ao 275 2 

误 着 EE 了 ”6 

总 计 98.109 8 

修正 后 总 计 18.160 ' 


a.R 方 = 0.896 (调整 后 民 方 = 0.758) 


图 10-133 方差 分 析 结 果 


结果 解释 ， 根 据 4、B、C、D 各 因素 的 卫 值 ， 发 现 只 有 4 因素 “前 者 时 间 ) 有 统计 
学 意义 ; 疗 疼 次 数 ， 用 水 倍数 及 浸泡 时 间 的 不 同 水 平 间 差 异 均 无 统计 学 意义 。 

SPSS 在 数据 菜单 中 ， 有 正 交 试验 方案 设计 ， 但 只 可 以 分 析 主 效应 ， 不 能 设计 交互 作 
用 ， 如 果 需 要 分 析 交 互 作 用 ， 则 需要 按照 正 交 表 和 正 交 交互 作用 表 安 排 试验 进行 分 析 。 
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> 10.10 有 裂 区 设计 方差 分 析 


裂 区 设计 是 多 因素 试验 的 一 种 设计 形式 。 在 多 因素 试验 中 ， 如 处 理 组 合 不 太 多 ， 而 
各 个 因子 的 效应 同等 重要 时 ， 可 以 采用 随机 区 组 设计 ; 大 研究 因素 有 主 次 之 分 时 ， 可 以 
采用 裂 区 设计 。 如 研究 茶 种 农作物 的 产量 时 ， 研 究 农 作物 品种 和 施肥 量 2 个 因素 ， 明 显 


10-134，4 为 主要 因素 ，B 为 次 要 因素 。 

案例 实战 

为 探讨 新 培育 的 4 个 辣椒 品种 的 施肥 技术 ， 采 用 和 裂 区 试验 设计 试验 。 以 施肥 量 为 主 
区 因素 4, 设 41、4,、4; 共 3 个 水 平 ， 品种 为 副 区 因素 B, 设 B、B,、B;、Bs 共 4 个 水 平 ， 
重复 3 次 (R=3) ， 其 试验 小 区 产量 (kg/ 小 区 ) ,设计 模式 图 如 图 10-134， 数 据 见 数据 
库 (datal0.15) 。 


图 10-134 和 裂 区 设计 模式 图 


案例 分 析 

本 例 采 用 了 裂 区 设计 ，3 次 重复 (区 组 R) ， 主 因素 4 (4,-4;) ， 副 因素 B (B.-B,)， 
必须 注意 的 是 ， 裂 区 设计 方差 分 析 ， 不 同 研究 因素 比较 时 的 误差 项 是 不 一 样 的 ， 见 图 
10-135。 请 注意 主 区 部 分 和 副 区 部 分 的 误差 项 是 不 一 样 的 。 


变异 来 源 DF 平 方 和 
主 区 部 分 ”区 组 r-1 SS =YT /ab-C 
A 了 $5,=YT?/rb-c 
误差 a (r-1)(a-1) SS。 = 主 区 $5-SS%-55, 
Ee ra-l 主 区 SS 
副 区 部 分 。 B Bb-l1 SSs =IT2/rm-C 
AXB (a-1}(5-1) SS 三 处 理 9S-SS -SS， 
误差 ba(r-1Xb-1) SSs = SS7- 主 区 总 SS-SSy-SS 
总 变 异 rab-1 SSr = 了 凡 -C 


图 10-135 ”二 有 裂 区 试验 自由 度 分 解 
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1. 调用 单 变 量 窗口 
菜单 : 分 析 一 一 般 线性 模型 一 单 变量 , 弹出 图 10-136。 将 产量 (weight) 放 入 因 变 量 框 ， 
A4 和 B 因素 放 入 固定 因子 ， 将 区 组 (R) 放 入 随机 因子 ， 点 击 “ 模 型 ”。 


i] 
i me ms 1 FE Eee 5 {Um ml 


| | 
| | 


”图 10-136 单 变量 设置 i 
2. 参数 设置 


(1) 模型 设置 : 如 图 10-136， 首 先 选择 “定制 ”， 然 后 按 图 10-137 所 示 ， 分别 将 R、 
A4、AxR、B 和 4xB 放 入 模型 框 ， 最 后 构建 项 选择 “ 主 效应 ”， 点 击 “ 继 续 ”。 注 意 交 互 
项 是 同时 选中 ， 构 建 项 选择 交互 ， 然 后 放 入 右 框 中 即 可 。 

(2) 事后 比较 设置 如 图 10-138, 将 4 和 B 放 入 事后 检验 框 , 两 两 比较 有 14 种 方法 ， 
选择 邓肯 (Duncan) 检验 ， 点 击 “ 继 续 ”。 具 体 如 何 选 择 根据 自己 的 研究 目的 ， 不 知 如 
何 选 择 的 话 可 参考 专业 期 刊 常 用 方法 。 

(3) 选项 设置 设置 如 图 10-139 所 示 。 


「 平 醒 定 等 方 竹 
国 党 浊 里 尼 T2iM) 图 科 尼 御 T3 国 关 困 其- 客居 外 避 ) 图 种 尾村 CU 


HE | ms | mm 


图 10-139 ”选项 设置 


主要 结果 解读 
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1. 主体 间 效 应 比较 ， 如 图 10-140， 图 中 B 和 4xB 的 误差 项 为 MS (error) =6.731， 
4 和 RR 的 误差 项 为 MS (4xR) =9.675。 结 果 可 见 区 组 (R)〉 差异 无 意义 ，4、B 差异 均 有 
意义 ， 并 且 4xB 存在 交互 作用 。 图 10-141 为 不 同 区 组 与 4 组 合 的 均值 结果 ， 根 据 该 图 ， 


制作 新 的 数据 库 ， 见 图 10-142。 


主体 间 效 应 检验 
国 变量 产量。 | 
源 川 灼 平 方 和 ”自由 讼 均 方 F 显著 性 
恐 忠 贸 设 B4676.967 1 BaBre.a6r roard.692 0.000 
a 162 2 Bo 加 
【IR 全 16221 2 0 083 0497 | 
| 误 荆 38.701 4 9.675b 
I a 假设 1318.024 2 659012 68.113 0001 | 
0 4 dS -nn。 od 
AR 很久 38701 4 9675 1437 0262 
课 莽 121.165 18 6.731° 
Me Ba 1975005 3 66556635 9784 000 | 
| 误差 121.165 18 6.731° | 
上 A*B ”起 设 416.307 6 69.385 10.308 0.000 | 
| 误差 121.165 18 6.731° | 
a. MS(RY 
b. MS(A* R) 
c，MS(i 刘 其 ) 


图 10-140 ”主体 间 效 应 


2. 4 和 B 事 后 比较 ， 如 图 10-141 和 图 10-142。 注 意 SPSS 刚才 在 主体 间 效 应 检验 时 ， 
4 和 B 末 用 了 不 同 的 误差 项 , 可 是 SPSS 在 事后 比较 时 ,4 的 误差 项 并 未 进行 调整 ,依旧 为 6.731。 
此 时 需要 对 4 的 事后 比较 进行 调整 。 本 例 图 10-141 结果 可 用 ， 发 现 B 不 同 品种 间 各 有 差异 ， 
产量 高 低 看 上 述 的 均值 。 图 10-142 结果 不 可 用 ， 此 处 列 出 只 是 让 大 家 进行 比 对 。 


因 变 量 ， 产 虽 


下限 

29.005 
40.539 
二 岛 呈 并 看 
3.316 


平河 值 。 颗 : 淖 误 鞋 
0.865 
0.865 
0.865 


0.865 


显 者 性 1.000 
树 显 示 齐 性 和 于 集中 各 个 组 的 平均 值 
二 十 京 测 平 均值 。 
re rer 
“i . 
b.Alpha= 0.05. 


1.000 


图 10-141 分 析 结 果 


圭 后 .日 50 


施肥 晤 
3 


2 
1 
显著 性 


45.133 


1.000 


让 案 归 


12 
12 
12 


0.749 
0.749 


36.475 


1.000 


95% 营 们 区间 

FF 限 FE 大 

十 筷 . 之 三 52.274 
38.410 41.557 
34.901 本 日. 口中 利 


39.983 
50.700 


1.000 1.000 


a. 使 用 面 和 平均 值 样本 太 小 = 12.000 
b. AMpha=0.05 


10-142 分析 结 果 
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.在 分 析 纯 
见 图 10-144。 


5 末 中 找到 图 10-143 所 示 的 结 朱 ， 用 框 中 标示 出 的 责 3 列 重 新 构建 数据 库 ， 


蚊 ' 国 3-133,sav 欧 气 化 引 - 1BM 5P55 Statistics 彼 杞 蝙 办 器 
充 件 下 架 往 丰 到 看 局 玛 冉 昌 乱 损 讶 荔 析 全 直销 山 田 隧 让 实用 程 所 0 扩 局 量 茵 口 尽 罗 助 刘 
EL] re 
io 1 


99% 置信 区 则 


= 


平均 值 


48.025 
92.400 
51.775 
40.675 
39.400 
39.875 
35.750 
36.050 
37.625 


1 标准 误 羡 


1.297 
1.297 
1.297 
1.297 
1.297 
1.297 
1.297 
1.297 
1 .297 


下 限 
45.300 
49.5975 
49.050 
37.950 
36.675 
37.150 
33.025 
33.325 
34.900 


上 限 
50.750 
59.025 
54.500 
43.400 
42.125 
42.600 
38.475 
38.775 
40.350 


I 


入 比较 框 ， 方 法 选择 Duncan 法 ， “继续 ”“ 确 定 ” 运 行 ， 碍 看 结果 。 

主体 间 效 应 结果 与 上 述 分 析 的 4 和 刃 的 已 值 完全 一 样 ， 但 4 的 两 两 比较 结果 与 图 
10-132 已 经 不 同 , 见 图 10-145。 其 中 的 误 关 项 为 2.419, 有 人 说 这 和 图 10-140 的 误 关 项 9.675 
不 一 致 ， 其 实 是 这 样 的 。 图 10-145 中 的 SE=sqrt CMS/r) =sqrt (24193) ， 而 图 10-140 中 的 
SE=sqrt (MS/rb) =sqrt (9.675/ (3x4) ) ， 两 个 算式 结果 相等 。 两 者 的 标准 误 SE 是 相等 
| LSEa=SExSSRa (新 复 极 差 法 ) 的 比较 标准 也 是 一 样 的 ， 因 此 ， 由 此 法 


39.98 
3 50.70 
0.051 1.000 


和 A 
3 36.48 
2 
1 


“显著 性 
柱 显 示 齐 性 了 集中 各 个 组 的 平均 值 ， 


引 . 使 用 再 和 平均 值 样本 大 小 = 3.000 ， 
b. Apha=0.05: 


图 10-145 分 析 结 果 


“第 11 章 卡 方 检 劝 


前 面 已 述 ， 变 量 家 族 有 计量 、 计 数 和 等 级 三 个 兄弟 ，t 检验 和 三 检 验 是 用 于 比较 组 间 
计量 资料 的 。 计 数 资 料 组 间 比 较 采 用 的 方法 是 卡 方 检验 。 该 检验 被 誉 为 二 十 世纪 科学 技 
术 所 有 分 支 中 的 20 大 发 明之 一 ， 它 的 发 明 者 是 卡尔 。 皮 尔 逊 〈Karl Pearson) 。 其 基本 
思想 是 真实 值 与 理论 值 的 吻合 程度 ， 简 单 到 不 难 理解 。 

举 个 例子 吧 ， 有 个 研究 生 4 目前 每 月 生活 费 有 1000 元 ， 他 即将 毕业 ， 理 想 中 的 刚 入 
职工 资 月 薪 3000 元 钱 ， 有 个 程序 员 互 月 薪 5000 元 , 他 的 目标 是 月 薪 10000 元 ,那么 请 问 ， 
两 人 谁 更 接近 自己 的 理想 呢 ? 很 多 人 会 认为 是 研究 生 ， 因 为 4 离 理想 之 差 2000 元 , 而 B 
离 理 想 差 5000 元 昵 。 其 实 不 是 ， 卡 方 检验 的 基本 思想 为 真实 与 理想 的 吻合 程度 ，4 离 上 自 
己 理想 的 差距 计算 应 该 为 (1000-3000) /3000=66.7%，B 离 自 己 理 想 的 差距 计算 应 该 为 

(5000-10000) /10000=50%， 意 思 是 4 离 其 理想 的 差距 还 有 66.7% 的 距离 ，B 为 50% 的 
差距 , 因此 妃 更 接近 上 自己 的 理想 , 在 实际 计算 中 , 为 了 保证 分 子 永 为 正 值 ， 分 子音 用 平方 ， 
因而 卡 方 (Chi square) =《 真 实 - 理想 ) / 理想 。 

为 了 保证 大 家 能 够 理解 卡 方 检验 的 思想 ， 册 看 一 个 专业 的 例题 ， 某 医生 将 170 名 和 急 
性 病毒 性 肝炎 病人 随机 分 成 2 组， 分 别 给 予 中 药 疗 法 和 西药 疗法 急性 治疗 ， 观 察 结果 如 
表 11-1 所 示 ， 问 两 种 疗法 的 有 效率 是 否 相 同 ? 


表 11-1 ”中药 和 西药 治疗 病毒 性 肝炎 病人 疗效 
有 效率 (% ) 
45 (41.88) 4 


46 (42.88) c 44 (47.12) d 90 (ctd=n,) 51.11 
89 (prd-ms) | 170 (atbtetd-n) 


案例 数据 解读 

表 中 中 药 治疗 80 人 , 有 效 35 人 , 无 效 45 人 ; 西药 治疗 90 人, 有效 46 人 , 无 效 44 人 ， 
其 中 的 35、45、46 和 44 是 该 医生 试验 得 到 的 结果 ， 是 实际 获得 的 数据 ， 我 们 把 它 叫做 
实际 频数 4 (Actural ffequency) ， 而 该 表 中 的 所 有 数据 均 是 由 这 4 个 实际 频数 计算 出 来 的 ， 
因此 该 表 也 称 为 四 格 表 ， 中 药 有 效率 43.75%， 西 药 有 效率 S1.11%， 虽 然 西 药 比 中 药 高 ， 
但 因为 存在 抽样 误差 ， 并 不 能 下 此 结论 ， 需 要 统计 分 析 ， 以 排除 抽样 误差 的 影响 。 

要 想 掌 握 卡 方 检 验 的 思想 ， 思 想 上 必须 要 跨 上 三 级 台阶 。 

(1) 第 一 级 人 台阶: 170 例 病 人 ， 人 合计 的 有 效率 为 47.65%， 现 在 假设 中 药 和 西药 治疗 的 
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有 效率 是 一 样 的 ， 那 中 药 和 西药 的 有 效率 应 该 等 于 多 少 昵 ? 必须 等 于 47.65%， 不 知道 这 点 
读者 能 否 理解 ， 因 为 两 组 人 数 不 同 ， 必 须 都 等 于 47.65%， 才 能 保证 总 的 有 效率 为 47.65% ! 

(2) 第 二 级 台阶 : 如果 两 组 有 效率 均 为 47.65%， 那 么 中 药 和 西药 理论 上 分 别 应 该 
多 少 人 有 效 呢 ? 应 该 用 80 乘 以 47.65%， 和 90 乘 以 47.65%， 分 别 得 到 中 药理 论 上 有 效 
38.12 人 , 无 效 41.88 人 , 西药 有 效 42.88, 无 效 47.12。 上 述 4 个 数字 为 假定 有 效率 相同 时 ， 
理论 上 获得 的 数字 ， 因 此 称 为 理论 频数 T (Theoretical frequency) 。 

(3) 第 三 级 台阶 ， 以 单元 格 a 为 例 ， 实 际 有 效 35 人 ， 理 论 有 效 38.12 人 。 如 果 中 
药 和 西药 治疗 有 效率 相同 并 等 于 47.65%， 那 么 实际 和 理论 就 应 该 相同 ， 可 是 35 与 38.12 
之 间 有 点 差距 ， 该 差距 有 两 种 可 能 ， 要 么 是 抽样 误差 导致 的 差距 ， 要 么 是 中 药 和 西药 的 
有 效率 本 身 就 不 同 导致 。 但 是 如 果 是 抽样 误差 导致 ， 则 应 该 每 个 单元 格 的 实际 频数 与 理 
论 频数 相差 不 大 才 对 。 则 4 个 单元 格 的 (4-T) 应 该 比较 小 。 可 是 细心 的 读者 会 发 现 ， 
任何 交叉 表 的 (4-7T) =0， 因 为 4-7 会 出 现 正 负 抵消 ， 为 了 不 抵消 ， 因 此 对 (44-7) 
进行 平方 ， 同 时 为 了 计算 吻合 程度 ， 每 个 差 值 均 需 除 以 其 理论 频数 7T， 因 此 可 以 得 到 公 
式 工 (C4-7) “/T， 这 就 是 卡 方 检验 的 理论 推导 公式 。 


字 11.1 成 组 四 格 表 卡 万 


上 面 花 了 点 篇 幅 帮 助 大 家 理解 卡 方 检验 的 基本 思想 ， 思 想 的 理解 有 助 于 后 续 统 计 方 法 
的 理解 与 实践 。 大 家 是 否 还 记得 两 组 独立 样本 1 检验 , 试验 设计 为 成 组 设计 , 两 组 相互 独立 ， 
效应 指标 为 计量 资料 (老大 ) ; 可 是 如 果 我 们 设计 依然 为 成 组 (2 组 ) 设计 ， 比 较 的 效应 
指标 为 二 分 类 〈 老 三 ) ， 就 不 能 采用 1 检验 了 ， 应 该 采用 成 组 四 个 表 资 料 卡 方 检验 。 

案例 实战 

茶 课题 组 采用 中 药 和 西药 治疗 茶 疾 病 ， 将 受 试 对 象 随机 分 为 中 药 组 和 西药 组 ， 获 得 
数据 如 下 ， 问 中 药 和 西药 治疗 有 效率 有 无 差别 ? (数据 文件 : datajd11.1.sav) 

表 11-2 et 


Ed 
案例 解析 
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为 疗效 (治愈 和 死亡 )， 为 计数 资料 中 的 三 分 类 。 故 本 例 为 2x2 表 资 料 卡 方 检验 。 

1. 构建 SPSS 数据 库 ， 注 意 表 11-2 的 资料 为 原始 数据 整理 后 的 二 维 统计 表 资 料 ， 对 
于 二 维 计 数 资 料 统 计 表 资料 ，SPSS 数据 库 构 建 永远 为 3 列 式 〈 行 变量 、 列 变量 和 频数 变 
量 ) ， 见 图 11-1; 如 果 为 原始 数据 ， 则 为 经 典 的 行列 式 ， 经 典 行列 式 是 不 需要 加 权 的 ， 
见 相关 章 市 

2. 加 权 

因为 本 例 有 权重 变量 频数 ， 因 此 进行 分 析 前 ， 首 先 应 该 进行 加 权 。 沫 单一 数据 一 个 
案 加 权 ， 将 频数 放 入 加 权 框 ， 上 点击 “确定 ”， 如 图 11-2 所 示 。 


| 
节 忆 条 


ee 2result 有 
1 
2 | 


13 
1 48 


图 11-1 案例 数据 库 图 11-2 ”个 案 加 权 

3. 卡 方 检验 交 又 表 设 置 

菜单 : 分 析 一 摘 述 统计 一 交叉 表 ;， 设 置 如 图 11-3 所 示 
result 放 入 列 变量 框 。 

4. 参数 设置 

太 击 图 11-3 中 的 “统计 ”, 如 图 11-4 所 示 , 义 选 “ 卡 方 ”。 点 击 图 11-3 中 的 “单元 格 ”， 
如 图 11-5 所 示 ， 勾 选 行 百分比 ， 点 击 “ 继 续 ”， 返 回 主 对 话 框 ， 点 击 “ 确 定 ”， 运 行 

主要 结果 解读 

(1) 卡 方 检验 主要 结果 为 两 步 法 : 第 一 步 看 交叉 表 〈 见 图 11-6) ， 获 知 相对 数 信息 ， 
产生 主观 意识 ， 本 例 中 药 治愈 率 为 76.8%， 西 药 治愈 率 为 94.1%， 给 我 们 的 感觉 是 西药 
效果 可 能 较 好 ， 但 是 也 可 能 是 抽样 误差 导致 的 ， 因 此 需要 进一步 统计 分 析 确 认 。 

(2) 第 二 步 ， 卡 方 检验 ( 见 图 11-7) ， 给 出 $ 种 卡 方 检验 结果 ， 本 例 看 框 中 标 出 的 
结果 ， 采 用 Pearson 卡 方 检验 ， 得 到 x =6.305*，P=0.012<0.05， 按 照 “大同 小 异 ” 的 口诀 ， 
差异 具有 统计 学 意义 ， 因 此 可 以 得 出 西药 的 有 效率 要 优 于 中 药 的 结论 。 


， 将 treat 放 入 行 变 量 框 ， 
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相关 性 IE) 


有 序 
列 联系 数 (D) Gamma 
Phi 和 克 革 如 V 萨 黑 斯 d(S) 
回 Lambda 此 德尔 tau-b 
此 德尔 tau- 


Kappa 
风险 山 
于 克 尼 马 未 (M) 


柯 克 兰 和 粤 特 尔 . 亨 塞 尔 统 计 (A) 
检验 一 般 比 值 比 等 于 中 : 1 


图 11-4 ”区 叉 表 统计 参数 设置 


变 叉 表 ; 单元 格 显 示 


计数 人 T) z 粮 验 

实测 (0) 比较 列 比 旧 MP) 

期 荀 {E) 园 调整 pi 十 : 邦 提 从 尼 法 ) (9) 
隐藏 较 小 的 计数 人 H) 


残 莽 
未 标准 化 (UU) 
标准 化 (8) treat * result 区 叉 表 


调整 后 标准 伦 世 ) result 


- 非 整数 权重 一 一 一 一 一 一 一 | 计数 
图 单元 格 计数 四 省 五 信人 必 ) 加 个 案 权 重 四 伸 五 入 (W) 二 te 本 的 百分比 
加 截断 单元 格 计数 [L) 时 截断 个 案 权重 {H) ee 
日 不 调整 (M) 四 的 。 计数 

占 treat 的 百分比 

计数 

占 treat 的 百分比 


图 11-6 ”交叉 表 
卡 方 检 驴 
渐进 显著 性 精确 显著 性 精确 显 着 性 
车 由 用 | 【 观 侧 ) 【 单 侧 | ) 

皮尔 型 卡 方 
连 综 性 修正 ” 5.016 1 0025 
似 然 比 作 6.779 1 0.009 
费 希 尔 精 确 检 验 0.015 0.011 
线性 对 联 6.246 1 0.012 
有 效 个 案 数 107 


a. 0 个 单元 格 (0.0%) 的 期 向 计数 小 于 5 : 最 小 期 望 计 数 为 7.63 。 
b. 仅 针对 2x2 表 进 行 计算 


图 11-7 卡 方 检验 结果 
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成 组 四 格 表 卡 方 检验 ， 软 件 会 自动 计算 5 种 卡 方 检验 ， 需 要 我 们 根据 研究 目的 和 条 
件 进行 选择 。 选 择 依据 参照 下 面 4 条 标准 ， 其 中 六 是 指 总 的 样本 量 ， 了 是 指 理论 频数 ， 
判断 时 请 一 定 注意 卡 方 检验 表 下 面 的 备注 ， 其 中 的 最 小 期 望 计 数 就 是 最 小 理论 频数 ， 本 
例 最 小 7=7.63>5，N=107>40， 因 此 看 第 一 行 的 Pearson 卡 方 检验 结果 ， 读 者 明白 如 何 选 
择 了 吧 ! 成 组 四 格 表 卡 方 检验 结果 选择 依据 : 
(1) N 三 40 and7T 宇 5: 选择 Pearson 卡 方 
(2) N 宇 40and 1 三 7<5: 选择 连续 性 校正 x 检验 
(3) n<40 or T<1: 选择 Fisher 精确 概率 法 
(4) NN 宇 40 and 7T 宇 5: 选择 似 然 比 x 检验 与 Pearson 卡 方 一 臻 
读者 可 以 用 三 个 成 语 来 帮助 你 记忆 : 四 十 不 惑 、 五 谷 丰 登 和 人 缺 一 不 可 。 


鸣 11.2 成 组 RxC 表 


前 面 说 的 是 成 组 中 的 2 组， 统计 学 存在 着 2K 效应 ，2 组 和 多 组 的 统计 方法 是 有 区 别 
的 ! 当 我 们 试验 设计 依然 为 成 组 ， 但 为 尺 (K 三 3) 组 设计 ， 此 时 不 管 效 应 指标 是 否 为 二 
分 类 或 者 多 分 类 ， 均 超过 的 4 个 单元 格 ， 因 此 这 类 表格 叫 成 组 RxC 表 ， 包 括 2xC、Rx2 
和 RxC 三 种 类 型 ， 三 种 类 型 差异 性 比较 分 析 方 法 均一 致 。 

案例 实战 

1979 年 某 地 发 生 松 毛虫 病 ，333 例 患 者 按 年 龄 分 为 2 组 ， 资 料 如 下 ， 分 析 不 同年 龄 
文件 请 见 datal1.2.sav) 


人 和 群 病变 类 型 结构 有 无 区 别 ? (数据 
表 11-3 不 同年 龄 松 毛虫 病 表现 型 构成 


案例 解析 
本 例 按照 属性 特征 年 龄 分 为 2 组， 为 成 组 设计 ， 效 应 指标 为 病变 类 型 分 为 4 型 ， 属 
于 计数 资料 ， 因 此 构成 2x4 的 行列 表 ， 应 该 考虑 RxC 表 资 料 卡 方 检验 。 
实战 步 对 
1 数据 库 构建 ， 记 得 还 是 三 列 式 ! 如 图 11-8 所 示 ， 
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2. 加 权 : 三 列 式 有 频数 列 的 交叉 表 ， 必 须 记 得 加 权 ， 数 据 一 个 案 加 权 ， 将 “人 数 ” 
放 入 个 案 加 权 框 ， 参 见 前 述 案 例 。 
锤 : 菜单 一 分 机 一 描述 统计 一 交叉 表 ， 如 图 11-9 所 示 ， 年 龄 分 组 放 入 行 ， 
疾病 构成 放 入 列 。 

4. 参数 设置 ; “统计 ”按钮 ， 选 择 “ 卡 方 ”，“ 早 元 格 按 钮 ”选择 行 白 分 比 ， 充 置 
同 图 11-4 和 图 11-5。 


a: | 癌 视 :33 沾 甘 量 


El 给 阿 


于 =), 


团 在 直 导 中 中 未 导 变量 {LY 
同 | 显示 或 半 亲 形 图 {BY 
同 排 际 老 [I) 


图 11-8 ”数据 格式 图 11-9 ”交叉 表 


5. 主要 结果 解读 

(1) 同样 为 两 步 法 ， 一 为 交叉 表 结 果 ， 由 图 11-10 可 见 儿 童 与 成 人 四 种 病变 类 型 
的 构成 比 ,我 们 可 以 发 现 , 成 人 以 皮炎 型 为 主 ,， 占 比 72.4%; 儿童 以 皮炎 型 (26.6%) 、 
骨 关 节 炎 (25.5%) 和 混合 型 (38.3%) 为 主 , 但 因为 是 样本 数据 ， 因 此 需要 统计 分 析 


判断 。 


| 


年 龄 分 组 “病变 构成 诡 久 表 
皮 交 型 ”上 骨 共 节 型 ” 软组织 炎 型 “。“ 混 语 型 总 计 
年 龄 分 钥 ”儿童 。” 计数 ee 
占 年 龄 分 组 的 百分比 
不 A i | Wr 
”上 占 年 龄 分 组 的 百分比 
总 计 计数 
占 年 龄 分 组 的 百分比 46.5 允 17.4% 7.5% 28.5% 100.0% 


图 11-10 交叉 表 描 述 结果 


(2) 卡 方 检验 结果 : 如 图 11-11 所 示 ， 本 例 Pearson 卡 方 检验 , x ==70.143*”，P=0.000< 
0.05，“ 大 同 小 异 ”， 此 处 可 得 儿童 和 成 人 得 了 松 毛 虫 病 之 后 的 病变 类 型 不 同 。 

企图 11-11 中 ， 共 有 三 种 卡 方 ， 如 何 选 择 呢 ? 

(1) Pearson 卡 方 : 无 任何 一 个 时 元 格 理论 频数 T<1， 且 1 三 7<5 的 格子 数 不 超 过 
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总 格子 数 的 1/5。 


汤 进 显著 性 
值 自由 度 (双全 ) 


nt 3.0U: ; 0 
线性 人 关联 45.074 1 0.000 
有 效 个 过 和 数 333 

a.0 个 单元 格 (0.0%) 的 期 莒 计数 小 于 5: 最 小 期 

向 计数 为 10.89。 


图 11-11 卡 方 检验 结果 
(2) 如 (1) 条 件 不 满足 ， 可 以 考虑 增加 样本 量 ， 专 业 上 进行 删除 或 者 合并 ; 采用 
RxC 表 资 料 的 Fisher 确切 概率 法 。 
(3) 线性 关联 ， 当 我 们 研究 目的 是 研究 是 否 存在 线性 趋势 时 使 用 , 详 见 后 续 的 案例 。 


这 11.3 成 组 RxC 表 效 应 指标 比较 


上 述 案例 中 ， 我 们 发 现 儿童 和 成 人 的 病变 构成 不 同 ， 到 底 哪里 不 同 呢 ， 可 以 进行 列 
的 比较 分 析 。 我 们 采用 例 datal1.2 的 数据 ， 进 行列 的 效应 比较 。 

实战 步 又 性 交叉 表 : 单元 格 旺 示 

1 打开 11.2.sav 数据 er 

2. 加 权 : 数据 一 个 案 加 权 ， 将 “人 数 ” 放 入 “|‖|Bm@ | map mmo 
个 案 加 权 框 中 ; 和 

3. 分 析 一 描述 统计 一 交叉 表 ， 将 年 龄 分 组 放 
入 行 ， 将 病变 构成 放 入 列 ; 

4. 参数 设置 “统计 ”选择 卡 方 ; “单元 格 ” 
选择 行 百 分 比 ， 同 时 勾 选 “比较 列 的 比例 ”， 如 


各 单元 格 计数 四 和 省 五 人 (N) 日 个 案 权 重 四 音 五 入 0W) 


11-12， 上 点击“ 继续 ”“ 确 定 ” 运 行 。 日 截断 单元 格 计数 LL) 日 截断 个 案 权重 (HH) 
: 日 不 调整 
5. 主要 结果 
本 例 分 析 结 果 大 多 与 上 述 案例 一 致 ， 不 同 之 
处 为 图 11-13。 结 果 可 见 在 病变 构成 的 频数 表 中 ， 图 11-12 单元 格 设置 


产生 的 a 和 b 下 标 ， 从 而 依据 下 标的 
主要 为 皮炎 型 与 其 他 三 型 的 构成 不 同 。 


下 同 ， 进 一 步 得 出 ， 儿 童 和 成 人 的 病变 构成 不 同 ， 
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年 龄 分 组 " 病变 构成 区 六 表 


计数 
占 年 龄 分 组 的 百分比 
计数 

占 年 龄 分 组 的 百分比 和 
总 计 计数 | age ee 
占 年 龄 分 组 的 目 分 比 46.5% 17.4% i.5% 28.5% 100.0% 
每 个 下 标 字母 都 指示 病变 构成 类 别 的 子 集 * 在 0.05 级 别 ， 这些 类 别 的 列 比例 相互 之 间 无 显著 差异 


图 11-13 分 析 结 果 


年 龄 分 组 ”儿童 


145 


> Ob 


前 面 成 组 四 格 表 卡 方 时 ， 说 到 Fisher 确切 概率 法 ， 对 于 四 格 表 资 料 ，Fisher 是 自动 
计算 的 ;而 当 RxC 卡 方 条 件 不 符合 时 ， 也 可 以 采用 Fisher 确切 概率 法 。 

案例 实战 

依然 选择 datal1.2 的 数据 为 例 ， 假 定 其 不 符合 条 件 ， 现 在 采用 RxC 表 确 
行 分 析 。 

实战 步骤 

1. 打开 数据 集 11.2.sav; 

2. 加 权 ， 对 人 数 进行 加 权 ; 

3. 分 析 一 描述 统计 一 交叉 表 ， 将 年 龄 分 组 放 入 行 ， 病 变 构成 放 入 列 ; 
4. 参数 设置 ; “统计 ”选择 卡 方 ， 勾 选 “ 精 确 ”， 
本 如 图 11-14 所 示 。 由 于 Fisher 计算 较为 占用 内 存 ， 当 数 
ee 据 量 较 大 ， 计 算 时 间 可 能 会 过 长 ， 因 此 ， 内 有 了 时间 设置 ， 
一 般 默 认 5min， 如 果 超 出 5min 还 未 计算 出 结果 ， 软 件 
a 自动 停止 运行 ， 否 则 软件 会 永远 计算 下 去 ， 直 至 计算 出 
enn mein | 结果。 故 当 数据 量 较 大 时 ， 我 们 可 以 选择 上 面 的 蒙特 卡 
ee 洛 近似 法 计算 ， 速 度 会 极 大 提升 ， 结 果 与 Fisher 确切 概 
| 率 法 几乎 一 致 。 
11-14 ”精确 检验 5. 主要 结果 : 见 图 11-15。 结 果 可 见 RxC 表 Fisher 
确切 概率 法 检验 ，P=0.000<0.05， 结 果 和 上 面 的 Pearson 卡 方 一 致 。 

注 ， 本 例 仅 是 采用 11.2 案例 数据 进行 演示 RxC 表 Fisher 确切 概率 法 。 


切 概率 法 进 


BL DLS TITTLE LL LLL LL LL 
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上 攻 方 愉 验 
渐进 显 赴 性 精确 显 和 性 精确 显 痢 性 
值 自由 度 【 双 侧 ) 【双人 出 ) ( 单 侧 ) 占 概率 
皮尔 逊 卡 方 70.143° 3 0.000 0.000 
st 73.004 3 0.000 0.000 


有 效 个 案 数 333 
.0 个 单元 格 0.0%) 的 期 臣 计 数 小 于 Fs 遇 小 期 忒 计数 为 10 .99 。 
b. 标准 化 统计 为 -6.714 。 


11-15 RxC 表 确 切 概 率 法 结果 


上 面 的 几 个 结果 中 , 均 有 线性 关联 分 析 的 结果 , 那么 线性 关联 是 怎么 回 事 , 如 何 用 呢 ? 
线性 关联 是 研究 数据 的 变化 是 否 具 备 线性 趋势 ， 如 高 一 学 生 近 视 眼 比例 30%， 高 二 为 
40%， 高 三 为 S0%， 我 们 想 研 究 是 否 随 着 年 级 的 增加 ， 近 视 眼 存在 线性 变化 的 趋势 。 趋 
势 检验 常用 的 是 Cochran-Armitage Test for Trend，SAS 中 可 实现 ，SPSS 中 用 的 是 linear 
by linear assoclatlon 。 

案例 实战 

己 知 某 地 区 的 某 一 人 和 群 在 2011 一 2015 年 的 某 急 性 传染 性 疾病 的 发 病情 况 数据 ， 数 据 如 
表 114 所 示 ， 请 分 析 此 人 和 群 该 疾病 的 发 病 率 逐年 是 否 具 有 线性 趋势 。 (数据 


表 11-4 2011 一 2015 年 某 人 群 某 病 的 发 病 率 


实战 步骤 

1. 构建 SPSS 数据 库 ， 见 图 11-16。 

2. 加 权 : 数据 一 个 案 加 权 ， 将 freq 放 入 加 权 框 ; 

3. 交叉 表 : 分 析 一 描述 统计 一 交叉 表 ，year 放 入 行 ，result 放 入 列 ; 

4. 参数 设置 “统计 ” 勾 选 卡 方 ,“ 单 元 格 ” 义 先行 百分比 点击“ 继续 ”“ 确 定 ” 运 行 ; 
5. 主要 结果 : 由 图 11-17 可 见 Pearson 卡 方 ，xX=17.316，P=0.002， 说 明 这 5 年 的 发 
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病 率 是 有 差别 的 ， 线 性 关联 卡 方 ,x=14.617，P=0.000<0.05， 说 明 不 同年 份 发 病 率 存在 
线性 增长 的 趋势 。 


Lveat [aresult oFreq ， 


2011 
| 2011 
| 2012 ”未 发 六 ] 卡 方 检验 
| 20] 3 及 病 者 性 
2013 ”未 发 ; | 值 自由 度 ( 双 侧 ) 
| D0144 = SE FB EE ma 
| 2014 
.9 | 2015 
看 0 因 2015 人 
a.0 个 单元 格 (0. Ee 的 期 请 计数 小 于 5 * 最 小 期 
望 计 数 为 35.0 
图 11-16 数据 格式 图 11-17 趋势 卡 方 结果 


> 11.6 配对 设计 方 表 


表面 上 检验 时 ， 说 到 配对 上 检验 ， 配 对 是 一 种 设计 ，! 检 验 主 要 用 于 计量 资料 的 比较 ; 
如 各 我 们 采用 配对 设计 ， 而 效应 指标 为 计数 资料 ， 此 时 则 需 采 用 配对 设计 卡 方 检验 。 我 
们 第 用 的 是 配对 设计 四 格 表 资料 (2x2) 卡 方 检验 (McNemar) ， 还 有 配对 设计 的 (KXxK) 
方 表 卡 方 检验 (McNemar-Bowker) 。 两 种 方法 在 SPSS 中 分 析 采 用 的 步骤 一 样 ， 用 的 都 


是 McNemar 检验 。 
案例 实战 


某 实 验 室 分 别 用 乳胶 凝集 法 和 免疫 荧光 法 对 58 名 可 疑 系统 性 红斑 狼疮 患者 血清 中 抗 核 抗 
体 进 行 测定 ， 结 果 见 表 11-5， 问 两 种 方法 的 检测 结果 有 无 差别 ? (数据 文件 请 见 datall 4.sav) 


a 


案例 解析 
本 例 对 58 名 可 疑 系统 性 红斑 狼疮 患者 ， 采 用 了 两 种 方法 同时 进行 检测 ， 检 测 结果 为 


朵 的 结 : 


阳性 与 阴性 ， 二 分 类 结果 ， 因 此 构成 配对 设计 的 四 格 表 资 料 ， 应 该 优先 考虑 McNemar 卡 


1. 打开 datal11.4.sav; 
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卡 万 检验 


2. 加 权 个 和 柔 : 数据 一 加 权 个 案 ， 将 频数 放 入 加 权 个 季 框 中 ; 
3. 集 单 : 分 析 一 搬 述 统计 一 交 文 表 ， 册 种 方法 ， 分 列 放 到 行 和 列 ， 顺 厅 没 天 系 。 


4. 参数 设置 


定 9 运行 。 


“统计 ”选择 “McNemar 卡 方 ”， 如 图 11-19 所 示 。 扣 击 “ 继 续 ”“ 确 


5. 主要 结果 解读 ， 如 图 11-20 所 示 ， 本 例 McNemar 卡 方 得 到 P=0.013”<0.05，“ 大 


EE ETEEE 生 


| 司 秽 13 肌 十 机 量 
| ”免疫 荧光 法 ,2 乳胶 凝集 法 | ”频数 
1 1 1 11 ! 


0 12 

1 2 

0 33 昌 
[| 国 | 


图 11-18 ”案例 数据 库 


案例 实战 


恰 交叉 表 : 六 计 [| 


卡 方 由 | 相 天 性 慌 ) 


着 澡 

加 列 联 亲 数 (QO) 

园 Phi 和 克 茜 姆 V 
图 |Lambda 

加 十 确定 性 条 数 山 ) 


肯 德 示 tau-b 
肯 德 尔 tau-c 


柯 克 兰 和 虹 特 尔 - 享 塞外 统计 内 
检验 一 技 比 值 比 等 于 加 ; | 


图 11-19 McNemar 卡 方 


两 名 医生 对 200 名 杭 肺 沉 痢 病 的 可 疑 患 者 的 诊断 结 


征 合 相同 ? 


表 11-6 甲乙 两 名 医生 检测 结果 


同 小 开 ”， 有 大 开 ， 因 此 可 街 免 疫 灾 论 法 和 乳胶 凝集 法 的 结 采 检测 结 打 不 同 。 


卡 方 检验 
稍 确 显著 性 
【强人 仙 | ) 
有 效 个 案 数 58 


a. 使 用 了 二 项 分 布 


图 11-20 分 析 结 果 


见 表 11-6， 试 分 析 两 名 医生 诊 


案例 解析 
本 例 200 名 可 疑 串 者， 分 列 由 2 名 医生 进行 诊断 ， 符 合同 一 受 斌 对象 采用 不 同 的 诊 
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采 方 法 进行 检测 的 配对 设计 ， 同 时 检测 结果 为 计数 资料 三 分 类 ， 本 例 为 3x3 方 表 。 因 为 
研究 者 考虑 的 是 两 名 医生 诊断 结果 是 否 有 达 开 ， 因 此 考虑 McNemar-Bowker 
如 果 研 究 者 研究 目的 为 两 个 医生 结果 是 否 一 至 选用 的 方法 为 Kappa 一 致 性 
会 介绍 。 数 据 文件 ，datal1.5。 

1. 构建 SPSS 数据 库 ，3 列 式 ， 如 图 11-21 所 示 ; 

2. 个 案 加 权 : 数据 一 个 案 加 权 ， 将 频数 放 入 加 权 框 中 ; 

3. 分 析 一 描述 统计 一 交叉 表 ， 将 甲 医生 和 乙 医 生 分 别 放 入 行 与 列 枉 ， 顺 序 没关系 ; 

数 设 置 ; “统计 ”选择 “McNemar 检验 ”， 如 图 11-19 所 示 。 

.主要 结果 : 如 图 11-22 所 示 ，McNemarBowker 检验 ，Y=0.482，P=-0.786>0.05, “大 
、 乙 两 位 医生 的 诊断 结果 差异 无 统计 学 意义 。 


| Ys 
I J ， 十 忆 \ 


检验 ， 后 面 


卡 方 检验 
请 进 亚 者 性 
但 目 由 了 腿 ( 双 侧 | ) 
溉 殉 尼 马尔 - 鲍 殉 检验 0.482 2 0.786 
有 疲 个 素数 200 


图 11-21 案例 数据 库 图 11-22 “分析 结果 


> 11.7 分 层 卡 方 


前 面 讲解 的 所 有 计数 资料 的 统计 表 均 为 二 维 表 ， 只 有 一 个 行 变量 
是 有 时 候 会 遇 到 多 个 行 变量 的 情况 。 如 研究 不 同性 别 不 同 血型 的 疾病 疗效 ， 就 是 一 个 3 
维 表 。 维 度 三 3 维 的 称 为 高 维 列 联 表 。 对 于 3 维 表 我 们 可 以 采用 分 层 卡 方 进行 分 析 ， 但 
对 于 更 高 的 维度 ， 可 以 采用 Logistic 回归 分 析 。 

案例 实战 

上 海 与 北京 两 地 发 生 又 毛虫 病 ， 观 察 儿童 与 成 人 的 疾病 构成 是 否 相 同 ? 数据 文件 : 
datall.6.sav。 


和 一 个 列 变量 ， 可 
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案例 解析 

本 例 是 在 例 11.2 数据 的 基础 上 , 增加 了 研究 地 区 , 因此 行 变量 为 地 区 (北京 和 上 海 ) 、 
年 龄 (儿童 和 成 人 〉 ， 列 变量 为 疾病 构成 ， 构 成 了 3 维 表 。 请 注意 : 统计 表 的 行 变量 一 
般 为 试验 的 干预 因素 ， 列 变量 为 效应 指标 。 数 据 格 式 见 图 11-23。 


_ 
地 区 1? 年龄 分 组 ?病变 构成 
上 海 皮炎 弄 
其 他 型 


皮炎 型 


图 11-23 ”案例 数据 库 


1. 打开 数据 库 datall.6.sav; 

2. 加 权 : 数据 一 个 案 加 权 ; 将 “人 数 ” 放 入 权重 变量 框 中 

3. 交叉 表 : 分 析 一 描述 统计 一 交 广 表 ， 见 图 11-24。 将 年 龄 分 组 放 入 行 ， 疾 病 构 成 放 
入 列 ， 地 区 放 入 层 。 

4. 参数 设置 “统计 ” 勾 选 卡 方 和 CMH 卡 方 ， 如 图 11-25 所 示 。“ 单 元 格 ” 勾 选 行 
上 自分 比 。 点 击 “ 继 续 ” 一 “确定 ”运行 。 


列 联 亲 数 [ 品 ) 
Phi 和 克 莱 姐 V 
Lambda 


团 在 志 导 中 显示 尽 变 县 (L) 
于 未 旋 羽 条 形 图 但 ) 
排险 表 人 ) 


图 11-24 交叉 表 设 置 图 11-25 分 层 卡 方 
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5. 主要 结果 解读 
(1) 卡 方 检验 : 图 11-26 分 别 计算 了 北京 地 区 、 上 海地 区 及 两 地 区 合并 数据 的 卡 方 
检验 结果 。 样本 量 均 大 于 40, 看 备注 , 理论 频数 均 大 于 5, 因此 参看 Pearson 卡 方 检验 结果 ， 
得 到 卫 值 均 小 于 0.05。 


卡 方 检 验 
浙 进 显著 性 ” ”精确 显 车 性 ” 精确 显著 性 

地 区 值 自由 度 [ 双人 删 ) (双全) 上 单 侧 ) 

上 海 度 尔 进 卡 方 43.332° 1 0.000 
连续 性 修正 。 41.323 1 0.000 
代 合 EE(L) 45.670 1 0.000 
费 希 尔 精确 检验 0.000 0.000 
线性 估 联 43.128 1 0.000 
有 效 个 案 数 213 

北京 皮尔 通 卡 方 297949 1 0000 

连续 性 修正 。 28.284 1 0.000 
似 损 比 (L) 30.406 1 0.000 
费 希 尔 精确 检验 0.000 0.000 
污 性 其 联 29.661 1 0.000 
有 效 个 案 妆 225 

总 计 “皮尔 逊 卡 方 71.213a 1 0.000 
连续 性 修正 ， 69.479 1 0.000 
亿 织 EE(L) 73.418 1 0.000 
更 希 尔 精 确 检 骗 0000 0.000 
线性 估 联 71.051 1 0.000 
有 区 个 率 数 438 


a. 0 个 单元 格 (0.0%) 的 期 望 计 数 小 于 5， 最 小 期 望 计 数 为 63.18 - 
b. 仅 针对 2x2 表 进 行 计算 

c.0 个 单元 格 (0.0%) 的 期 启 计 数 小 于 5 - 最 小 期 望 计 数 为 26.69 
d. 0 个 单元 格 (0.0%) 的 期 党 计数 小 于 5， 最 小 期 稼 计数 为 36.52 - 


图 11-26 分 层 卡 方 结果 


(2) 比值 比 齐 性 检验 : 图 11-27 (A) 其 实 是 层 间 差异 性 检验 ， 结 果 发 现 P=0.150> 
0.05， 说 明 地 区 层 间 差异 无 统计 学 意义 。 

(3) 条 件 独 立 性 检验 : 图 11-27 (B) 是 在 扣除 了 地 区 影响 之 后 ， 不 同年 龄 与 病变 
类 型 间 关 系 ， 采 用 了 Cochran*s 和 Mantel-Haenszel 两 种 卡 方 检 验 ， 前 者 是 后 者 的 改进 版 ， 
发 现 P 卫 均 小 于 0.05， 说 明 儿 童 和 成 人 的 病变 类 型 差异 存在 统计 学 意义 。 

(4) Mantel-Haenszel OR 值 估 算 : 图 11-28 结果 可 见 OR FF0.1$1， 因 为 本 例 变量 设 
置 年 龄 (1= 儿童 ，2= 成人) ， 病 变 (1= 皮炎 型 ，2= 其 他 类 型 ) ， 故 OR=0.151 是 指 成 
人 得 其 他 类 型 的 松 毛虫 病 是 儿童 的 0.151 倍 ， 换 言 之 ， 成 人 得 皮炎 型 松 毛虫 病 的 机 会 是 
儿童 的 1/0.151=6.62 倍 。 
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A 比值 比 齐 性 检验 
渐进 显著 性 


卡 方 目 由 度 4 双 侧 ) 


Breslow-Day 2.077 1 D150 
塔 罗 内 2.077 1 0.150 受 特 和 汞 - 享 塞 东 一 般 比 值 比 估算 
估 和 前 0.151 
条 件 独立 性 检验 Im 估算 值 ) -1 .891 
寺 这 于 于 全 In(Estimate) 标准 误 鞭 0.237 
卡 方 自由 度 [ 双 侧 ) 渐进 显著 性 ( 双 侧 ) 0.000 
柯 克 兰 71.665 1 0000 渐 近 95 入 置信 区 则 般 比 值 比 下 限 0.095 
曼 特 尔 - 享 塞 尔 69.601 1 0.000 上 限 0.240 
在 条 件 独 立 性 假定 下 ， 仅 当 层 数 固定 ， 而 曼 特 尔 - 享 塞 尔 统 _ In( 一 般 比 值 比 ) ”下 限 -2.355 
计 始 终 浙 近 分 布 为 1 自由 度 卡 方 分 布 时 ， 柯 克 兰 统计 才 当 上 限 1 426 
近 分 布 为 1 自由 度 卡 方 分 布 : 请 注意 ， 当 实测 值 与 期 望 值 一 一 一 
之 苹 的 总 和 为 0 时 ， 曼 特 尔 - 享 密 尔 统计 和 交 不 会 进行 连续 性 曼 符 尔 - 享 塞 尔 一 般 比 值 比 估算 在 假定 一 般 比 值 比 为 1.000 
修正 。 的 前 提 下 进行 渐 近 正 柱 分布" 自然 对 数 估算 也 是 如 此 。 
图 11-27 比值 比 与 条 件 独 立 检验 11-28 ”MH OR 估算 


> 11.8 卡 方 分 割 


大 家 是 否 还 记得 ， 方 差分 析 和 人 


到 P<0.05， 认 为 多 组 间 存 在 差异 之 后 ， 我 们 做 了 事后 
两 两 比较 检验 。 然 而 进行 RxC 表 资 料 卡 方 检 验 ， 当 发 现 多 组 组 间 存 在 差异 ， 软 件 并 未 提 
供 两 两 比较 的 方法 ， 此 时 我 们 需要 人 为 的 对 统计 表 进 行 分 割 分 析 ， 即 卡 方 分 割 。 

卡 方 分 割 就 是 对 检验 水 准 a 进行 调整 ， 有 两 种 分 割 方式 : 

(1) 比如 4、B 和 CC 三 组 资料 比较 ， 则 两 两 比较 需要 进行 3 次 ，4B、A4C 和 BC， 
则 检验 水 准 a'=2/K (K-1) =c/3=0.0167; 

(2) 若 是 4 组 .8B 组 和 对 照 组 三 组 资料 , 各 组 只 和 对 照 组 比较 , 则 比较 次 数 为 组 数 天 -1 
次 ， 即 a'=a/ (Kk-1)〉=0.05/2=0.025。 得 到 a' 之 后 ， 我 们 进行 卡 方 检验 ， 只 有 统计 分 析 得 
到 的 也 值 小 于 a' 才 为 具有 统计 学 意义 ， 不 再 是 小 于 0.05 为 有 统计 学 意义 的 标准 了 。 

案例 实战 

某 研 究 者 研究 了 三 种 药物 治疗 文 气管 炎 疗 效 比 较 ， 见 表 11-7， 数 据 文件 :datall.7.sav。 


表 11-7 ”三 种 约 物 治疗 文 气管 炎 疗 效 比较 
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案例 解析 
本 例 为 3x2 行列 表 资 料 ， 采 用 Pearson 卡 方 检 验 ，Y =25.66，P<0.05， 可 以 认为 三 组 
疗效 差异 存在 统计 学 意义 ,可 是 到 撒 是 全 部 有 差 卉 还 是 茶 两 药 有 差异 , 则 需要 卡 方 分 割 。 
本 例 三 组 需 两 两 比较 ， 共 需 比 较 3 次 ， 因 此 a'=0.0167。 
然后 进行 4 药 和 B 药 构成 的 四 格 表 进行 卡 方 检验 ,x=2.22，P=0.136>0.0167， 
认为 4 药 和 B 药 差异 无 统计 学 意义 ， 再 进行 4 药 和 C 药 四 格 表 卡 方 , x =23.418， 
P=0.000<0.0167, 认为 4 药 和 C 药 差异 存在 统计 学 意义 ; 再 次 进行 了 药 和 C 药 四 格 表 卡 方 ， 
X=12.636，P=0.000<0.0167， 认 为 药 和 C 药 差异 存在 统计 学 意义 。 
本 例 所 采用 的 方法 ， 前 面 内 容 均 已 介绍 ， 为 节约 篇 幅 ， 此 处 不 歼 。 
至 此 ， 卡 方 检验 所 涉及 的 几乎 所 有 类 型 均 已 介绍 ， 下 面 给 大 家 做 一 个 简单 的 方法 
忆 结 ! 
图 ”成 组 设计 : 
成 组 设计 四 格 表 (2x2 ) 
成 组 设计 行列 表 (2xC、Rx2、RxC ) 
2xC: (C 若 无 奈 ) : Pearson 卡 方 
( C 若 有 序 ) : 非 参 数 检验 
Rx2: RR 有 序 等 同 无 序 . Pearson 卡 方 
尺 有 序 ， 看 线性 趋势 : 线性 趋势 卡 方 
RR 无 奈 : Pearson 卡 方 
RxC. 双向 无 序 : Pearson 卡 方 
及 有 C 无 : Pearson 卡 方 
R 无 C 有 : 非 参 数 
RR 有 C 有 属性 不 同 : Spearman 相 关 
配对 设计 : 
配对 设计 四 格 表 (2x2 ) -McNemar 
配对 设计 行列 表 ( 方 表 ) 
双向 无 厅 属 性 相同 : McNemar-Bowker ( MB ) 
双向 有 序 属 性 不 同 : Spearman、 线 性 趋势 卡 方 
双向 有 序 属 性 相同 : Kappa 一 致 性 、MB 


和 > >“ 第 12 章 等 级 资料 比较 


变量 家 族 中 较为 常见 的 计量 资料 (老大 ) 、 计 数 资 料 〈( 老 三 ) 前 面 均 已 介绍 ， 本 章 
讲解 等 级 资料 〈 老 二 ) 。 等 级 资料 具有 计数 资料 的 性 质 的 同时 又 有 定性 比较 的 特性 ， 采 
用 的 方法 与 上 述 章 节 也 不 一 样 了 。 下 面 分 4 种 情况 和 大 家 介绍 。 


> js 


RxC 表 资 料 ， 分 为 行 变量 和 列 变量 ， 行 变量 通常 为 我 们 的 干预 因素 ， 列 变量 为 试验 
效应 指标 。 当 行 变量 和 列 变 量 为 有 序 时 ， 方 法 也 有 区 分 。 


12.1.1 列 有 了 订 


案例 实战 
采用 3 种 药物 治疗 慢性 骨 炎 疗效 数据 见 表 12-1。 试 分 析 三 种 药物 的 疗效 有 无 差别 。 


表 12-1 三 种 药物 治疗 慢性 胃炎 疗效 比较 


案例 解析 

本 例 行 变 量 药 物 为 干预 因素 ， 分 为 3 个 水 平 (4、B 和 C) ， 列 变量 疗效 为 效应 指标 ， 
分 为 4 个 水 平 ， 但 此 处 疗效 《治愈 、 显 效 、 好 转 和 无 效 ) 为 等 级 资料 。 本 例 目的 为 比较 
3 种 药物 的 疗效 差异 ， 因 此 应 该 采用 非 参数 检验 或 者 Ridit 分 析 。 有 具体 分 析 见 第 13 章 ， 
非 参 数 检验 。 


12.1.2 行 有 了 厅 


有 人 研究 食管 癌 TNM 分 期 与 CAM-1 基因 表达 的 关系 ， 获 得 数据 如 表 12-2 所 示 。 
其 中 研究 因素 为 食管 癌 的 分 期 ， 分 为 IT_I 工 和 II 期， 为 等 级 资料 。 效 应 指标 为 CAM-1 是 
否 表 达 ， 为 二 分 类 计数 资料 。 所 以 本 例 为 行 有 序 ， 列 无 序 ， 此 类 资料 等 同 于 双 同 无 序 ， 
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即 第 11 章 RxC 表 资 料 。 方 法 前 面 已 述 ， 此 处 不 歼 。 
表 12-2 食管 癌 TNM 分 期 与 CAM-1 基因 表达 


> 12.2 RxC 表 (双向 有 序 ) 
当 RxC 表 双 同 痢 是 有 序 时 ， 分 为 属性 相同 与 属性 不 同 两 种 情形 。 下 面 分 别 讲解 。 


12.2.1 属性 相同 


案例 实战 
两 名 医生 对 200 例 病 理 切片 进行 分 化 程度 诊断 ， 结 果 如 表 12-3 所 示 ， 问 两 名 医生 的 
诊断 结果 是 否 一 致 ? 数据 文件 data12.1.sav。 


表 12-3 两 名 医生 对 200 例 病 理 切 片 诊 断 结 果 


案例 解析 

本 例 每 一 张 切片 ， 均 被 2 两 名 医生 进行 独立 的 诊断 ， 属 于 同一 标本 采用 不 同 的 检测 
方法 的 设计 ， 即 配对 设计 。 研 究 的 效应 指标 为 分 化 程度 ， 分 为 低 度 分 化 、 中 度 分 化 和 高 
度 分 化 ， 属 于 等 级 资料 。 所 谓 属 性 相同 ， 是 指 配对 设计 的 效应 指标 均 为 同一 指标 ， 均 是 
等 级 资料 。 本 例 的 研究 目的 判断 两 名 医生 诊断 结果 是 否 一 致 , 可 以 采用 Kappa 一 致 性 检验 。 

1. 参照 表 12-3 构建 SPSS 数据 库 ， 如 图 12-1 所 示 。 

2. 加 权 : 数据 一 个 案 加 权 ， 将 F 人数 放 入 加 权 框 ; 

3. 分 析 一 描述 统计 一 交叉 表 ， 将 甲 医生 放 入 行 ， 乙 医生 放 入 列 ; 

4. 参数 设置 如 图 12-2 所 示 ，“ 统 计 ” 义 选 Kappa， 斥 击 “ 继 续 ”“ 确 定 ” 运 行 ; 


| 第 12 章 等 级 资 


卡 启 IH) 


省 愉 - 


园 列 联 疡 数 上 ) 

局 Phi 和 区 某 姆 V 
加 | Lambda 

国 不 确定 性 党 数 [U) 


回 卖 克 尼 马 外 贡 ) 


加 | 柯 克 兰 和 虹 特 钙 - 孚 奔 沙 加 计 人 


术 验 一 接 比 什 比 等 于 吕 ) : |1 


图 12-1 案例 数据 库 图 12-2 交叉 表 : 统计 设置 


由 图 12-3 可 得 : Kappa =0.471，P=0.000<0.05， 说 明 前 面 的 Kappa 值 是 真实 存在 
` 古 抽样 误 大 于 致 的。 Kappa 值 的 专业 意义 如 下 : Kappa 宇 0.75 时 , 表明 两 者 一 致 性 较 好 ; 


0.75>Kappa 三 0.4 上 时， 未 投 ; Kappa<0.4 时 ， 表 明 两 者 一 任性 较 破 。 所 以 本 例 
Kappa=0.471, 说明 两 名 医生 的 认 依 断 一 致 性 一 般 。 


而 


ET 
渐 近 标准 误 莽 a 


近似 下 


”协议 测量 05 9 401 
有 效 个 案 数 00 


a. 未 假定 原 假设 。 
b. 在 假定 原 根 设 的 情况 下 使 用 渐 近 标准 误差。 


图 12-3 Kappa 一 致 性 结果 


12.2.2 ”属性 不 同 
本 例 实 成 


四 ， 


究 蝇 状 体 浑浊 程度 与 年 龄 的 关系 ， 想 知道 


是 否 随 看 年 龄 的 增加 晶状体 浑 
案例 解析 


本 例 为 受 试 对 象 按照 年 龄 分 组 ， 分 成 3 组 (20-，30- 和 40-) ， 年 龄 分 组 为 等 级 资料 
效应 指标 为 晶状体 浑浊 程度 ， 分 为 +、++ 和 +++， 也 是 等 级 资料 。 本 例 是 双向 有 序 ， 但 
因为 摘 述 的 指标 不 同 ， 因 此 为 双 加 有 序 属 性 不 同 的 资料 。 此 类 资料 ， 一 般 的 研究 目的 为 
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是 否 随 着 一 个 等 级 的 增加 ， 另 一 个 也 增加 的 相关 关系 ， 因 为 数据 为 等 级 资料 ， 因 此 可 以 
计算 Spearman 相关 性 。 此 处 不 袭 ， 请 见 第 15 章 相 关内 容 。 
表 12-4 ”晶状体 浑浊 程度 与 年 龄 关系 
晶状体 浑浊 程度 


前 面 介 绍 的 处 理 计量 资料 的 统计 分 析 方 法 为 参数 检验 ， 参 数 检 验 对 于 总 体 的 分 布 有 
一 定 的 要 求 ， 参 数 检 验 的 条 件 较为 苛刻 ， 如 上 和 环 的 独立 、 正 态 和 方差 齐 。 当 资料 不 满 
足 时 ， 理 论 上 运用 上 述 方法 会 有 一 定 的 误差 ， 如 果 不 用 1 和 瑟 ， 还 有 没有 其 他 方法 来 进 
行 补充 呢 ? 这 就 是 本 章 所 讲 的 非 参 数 检验 ， 非 参数 检验 就 像 广 谱 抗 生 素 一 样 ， 适 用 范围 
更 广 ， 适 用 计量 、 等 级 和 计数 资料 统计 分 析 。 而 参数 检验 只 适用 于 符合 条 件 的 计量 资料 
的 组 间 比 较 。 

非 参 数 检验 不 需要 知道 原始 数据 的 数值 大 小 , 只 需要 知道 数据 的 位 次 即 可 进行 分 析 。 
松 哥 用 一 个 案例 简单 描述 一 下 ， 比 如 我 们 想 知 道 某 高 校 大 学 生 中 男生 和 女生 的 身高 是 否 
有 差异 ， 在 该 高 校 随机 抽取 了 200 名 大 学 生 。 现 在 我 们 不 需要 测定 每 一 名 学 生 的 身高 ， 
也 可 以 进行 男女 生 的 身高 比较 。 

怎么 做 昵 ， 我 们 让 200 名 学 生 按 照 身高 从 矮 到 高 站 一 纵队 ， 然 后 从 第 一 位 开始 报 数 ， 
每 人 记 着 自己 的 位 次 ， 然 后 男生 向 右 跨 出 一 步 ， 则 分 为 两 组 ， 理 论 上 女生 比 男生 矮 ， 因 
此 女生 所 有 人 的 位 次 之 和 将 小 于 男生 的 位 次 之 和 ; 可 是 如 果 男 女生 人 数 不 等 ， 会 影响 位 
次 之 和 ， 所 以 我 们 用 位 次 之 和 除 以 每 组 的 人 数 ， 得 到 的 就 叫做 秩 均 值 。 理 论 上 男生 的 秩 
均值 应 该 比 女生 大 ， 当 大 的 比例 超出 一 定 范围 ， 则 有 理由 认为 男生 的 身高 要 高 于 女生 ， 
具体 的 统计 分 析 方 法 ， 就 叫做 非 参 数 检验 。 下 面 我 们 按照 SPSS 软件 非 参 数 菜 单 里 的 顺 
序 进行 介绍 。 


> 13.1 非 参 数 卡 方 


SPSS 中 的 非 参 数 卡 方 主要 用 于 分 析 单 组 计数 资料 是 否 符合 特定 的 分 布 。 

案例 实战 

某 高 校 随机 抽取 600 名 学 生 (数据 文件 data01.sav) ， 想 知道 性 别 (男生 和 女生 ) 是 
否 符 合 1 : 1 分布 ? 或 者 是 否 符合 0.4 : 0.6 分布? 


案例 解析 
本 例 研究 茶 组 资料 的 计数 变量 是 人 否 符合 采种 分 布 ? 可 以 用 非 参数 卡 方 进行 验证 。 
实战 步骤 


1. 打开 data01.sav 数据 库 ; 
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2. 沫 单 : 分 析 一 非 参 数 一 旧 对 话 框 一 卡 方 ， 弹 出 图 13-1 卡 方 检验 功能 窗口 。 将 性 别 
放 入 检验 变量 框 ， 同 时 选择 所 有 类 别 相 等 。 点 击 “ 确 定 ” 运 行 。 

3. 主要 结果 : 如 图 13-2 所 示 ， 得 x=0.736*”，P=0.391>0.05，“ 大 同 小 异 ”， 因 此 ， 
该 群 里 的 男 、 女 生 比 例 符 合 1 : 1 的 假设 。 


检验 统计 
性 别 | 
自由 度 
jastE oa 
3. 0 个 单元 格 (0.0%) 的 期 望 天 率 低 于 5 : 期 
党 的 最 低 单元 格 顿 率 为 299.5 。 


图 13-1 卡 方 检验 界面 图 13-2 卡 方 检验 结果 


4. 如 果 分 析 是 否 符合 0.4 : 0.6 的 比例 ， 则 按 图 13-3 设置 ， 得 到 结果 如 图 13-4 所 示 。 
可 见 xX=34.47”，P=0.000<0.05，“ 大 同 小 异 ”， 性 别 的 男 、 女 生 比 例 不 符合 04 : 0.6 的 比例 。 


加 信 数据 中 获取 (GG) 
曲 使 用 指定 范围 (8) V 答 验 统计 
下 限 由 ): 
上 限 () : 人 
卡 方 34.475a 
自由 度 1 
” 渐 近 显著 性 0.000 


a. 0 个 单元 格 (0.0%) 的 期 膏 屯 素 低 于 5， 其 
望 的 最 低 单 元 格 频 率 为 239.6 


图 13-3” 拟 合 优 度 卡 方 图 13-4 拟 合 优 度 卡 方 结果 
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> A A 二 项 检验 


二 项 分 析 功 能 是 验证 计数 资料 是 否 符 合 二 项 分 布 的 检验 ， 我 们 仍 以 data 01.sav 数据 
库 为 例 ， 验 证 性 别 是 否 符合 二 项 分 布 。 

1. 打开 数据 集 data01.sav; 

2. 菜单 : 分 析 一 非 参 数 一 旧 对 话 框 一 二 项 ， 弹 出 图 13-5 二 项 检验 功能 窗口 。 将 性 别 
放 入 检验 变量 框 ， 设 置 检 验 比 例 ， 本 例 为 0.50。 点 击 “ 确 定 ” 运 行 。 如 果 放 入 框 中 的 为 
计量 资料 ， 则 需要 设置 分 割 点 ， 如 身高 设置 分 割 点 为 165cm,， 则 软件 以 此 分 割 点 将 数据 
分 为 两 部 分 ， 然 后 验证 两 部 分 是 否 符合 二 项 分 布 。 


加 从 数据 中 获取 从) 
从 分 割 点 (C): l 


图 13-5 一 项 分 布 检验 


3. 主要 结果 : 如 图 13-6 所 示 ， 得 到 二 项 检验 P=0.414>0.05，“ 大 同 小 异 ”， 以 此 认 
为 性 别 符合 0.50 比例 的 三 项 分 布 。 二 项 分 布 检验 只 适用 结局 变量 为 二 分 类 情形 ， 如 果 放 
入 血型 变量 ， 则 软件 不 予 计 算 并 给 出 警告 ， 大 家 自行 尝试 。 


二 项 检验 
精确 显 着 性 
类别 个 素数 。 ”实测 比例 检验 比例 ( 双 尾 ) 
性 别 ”组 1 Ei 310 0.52 0.50 0.414 
组 2 并 289 0.48 
总 计 599 1.00 


图 13-6 二 项 分 布 检验 结果 
对 于 13.1 和 13.2 节 内 容 ， 大 家 会 发 现 两 种 方法 均 可 以 检验 性 别 ， 而 且 结 果 也 基本 一 
致 ， 但 13.1 的 方法 可 以 针对 各 种 类 型 计数 资料 (二 分 类 、 多 分 类 和 等 级 ) ， 而 13.2 只 能 
进行 二 分 类 资料 分 析 。 
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守 13.3 游程 检验 


游程 检验 是 验证 一 组 数据 是 否 符合 随机 分 布 。 在 实际 研究 中 ， 经 常 需 要 考虑 一 个 序 
列 中 的 数据 的 出 现 是 否 与 顺序 无 天， 这 关系 到 数据 是 否 独 立 。 如 果 数 据 有 上 升 或 者 下 降 
的 趋势 ， 或 有 周期 性 变化 的 规律 等 特征 ， 均 可 能 表示 数据 与 顺序 是 有 关 的 ， 或 者 说 序列 
不 是 随机 出 现 的 。 

游程 检验 是 将 研究 数据 转化 为 由 0 或 1 连续 构成 的 串 ， 称 为 一 个 游程 ， 一 个 游程 中 
的 数据 的 个 数 称 为 游程 的 长 上 度 ， 一 个 序列 中 游程 的 个 数 用 R 表 示 ， 表 示 0 和 1 区 蔡 轮 换 
的 频繁 程度 。 如 序列 1100001110110000111100，R=8， 游 程 长 度 分 别 为 2、4、3、1、2、4、 
4、2。 游 程 数 过 多 说 明 周 期 特征 明显 ， 流 程 过 少 说 明 数 据 存 在 聚集 。 

案例 实战 

某 工厂 生产 出 来 20 个 工件 ， 其 尺寸 分 别 为 12.27cm、9.92cm、10.81cm、11.79 cm、 
ll.8/ cm、10.90 cm、 11.22 cm、10.80 cm、10.33 cm、 9.30 cm、9.81 cm、8.83 cm、 
9.32 cm、8.67 cm、9.32 cm、9.53 cm、9.58 cm、8.94 cm、7.89 cm、10.77 cm， 现 在 想 
知道 ， 工 件 尺寸 的 变化 是 否 只 是 由 于 随机 因素 引起 ， 还 是 有 其 他 因素 影响 。 数 据 文件 : 
datal3.3.sav。 

实战 步骤 

1. 将 尺寸 数据 构建 SPSS 数据 库 (data 13.3.sav) 。 

2. 分 析 一 非 参 数 一 旧 对 话 框 一 游程 检验 ， 如 图 13-7 所 示 。 将 “工件 尺寸 ” 放 入 检验 
变量 框 ， 分 割 点 选择 中 位 数 。 上 点击“ 确定 ”运行 。 

3. 主要 结果 

如 图 13-8 所 示 ， 游 程 检验 Z=-_3.446，P=0.001<0.05，“ 大 同 小 异 ”， 说 明 数 据 
分 布 与 随机 分 布 有 差异 ， 因 此 上 述 工件 生产 大 小 不 仅仅 是 由 随机 因素 产生 ， 还 存在 其 
他 影响 斥 寸 的 因素 。 研 究 者 可 以 继续 研究 ， 如 果 能 找到 该 因素 ， 对 产品 质量 的 提高 将 
很 有 益处 。 

简单 举 几 个 游程 检验 在 生物 医药 领域 的 例子 ， 如 某 医 院 产 科 在 收集 一 段 时 间 内 产妇 
生产 婴儿 的 性 别 ， 可 以 分 析出 生性 别 是 否 是 随机 的 ; 沿 着 某 河 流 发 生 了 某 种 传染 病 ， 按 
照 河 流水 的 流向 排序 ， 看 沿 河 住户 是 否 发 病 ， 可 以 构成 010100001010 数据 ， 可 以 分 析 发 
病 病 例 是 否 具有 聚集 性 等 。 
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游程 检验 

工作 尺寸 cm 

检验 值 9.87 

个 率 数 < 检验 值 10 

个 案 北 >= 检验 值 10 

rE 总 个 案 数 20 
二 辣 0D) 游程 数 司 
回 平均 信 (E) 梧 直击) ; 之 -3.446 
渐 折 显 着 性 ( 双 尾 ) 0.001 

3. 中 位 数 

13-7 ”游程 检验 图 13-8 ”游程 检验 结果 


也 13.4 时 样本 K-S 检验 


单 样本 天 -S 检验 是 用 于 验证 数据 是 否 符合 正 态 分 布 、 均 匀 分 布 、 指 数 分 布 和 泊 松 分 
布 四 种 分 布 的 。 

案例 实战 

我 们 以 data01 数据 库 为 例 ， 看 身高 数据 是 否 符合 正 态 分 布 。 

1. 打开 数据 库 ; 

2. 分 析 一 非 参数 一 旧 对 话 框 一 单 样本 K-S 检验 ， 如 图 13-9 所 示 ， 将 身高 放 入 检验 变 
量 框 ， 勾 选 正 态 分 布 ， 氮 击 “确定 ”运行 。 

3. 主要 结果 

由 图 13-10 可 知 ， 天 -S 检验 =0.071，P=0.000<0.05，“ 大 同 小 异 ”， 身 高 分 布 不 符合 
正 态 分 布 。 


TT 


身高 
个 案 数 590 
正夫 参数 ab ”平均 值 。 “164.379 
标准 着 7.9816 


最 极 请 董 值 。 绝对 0.071 
正 0.060 
商 -0.071 
| 检验 统计 0.071 
正 党 电 ) 问 均 习 志 ) 渐 近 显著 性 ( 双 尾 ) 0.000° 
| 0 器 指数 E)| a. 检验 分 布 为 正 坊 分 布 。 
b. 根据 数据 计算 ， 


c. 里 利 氏 显著 性 桥 正 * 


图 13-9 单 样本 Kk-S 检验 图 13-10 分 析 结 果 
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了 13.5 2 独立 样本 检验 


案例 实战 
继续 以 data01 数据 库 为 例 ， 分 析 不 同性 别 学 生 的 肺 呼 量 (mmL) 是 否 有 差异 。 
案例 解析 


不 同性 别 学 生 的 肺 呼 量 ， 如 果 符 合 独立 、 正 态 和 方差 齐 ， 首 先 我 们 想到 两 独立 样本 
检验 ; 因为 非 参 数 检验 使 用 范围 更 广 ， 我 们 也 可 用 2 独立 样本 的 非 参数 检验 。SPSS 给 出 
4 种 检验 方法 : 

1. Mann-Whitney U 检验 

该 检验 等 同 于 两 组 数据 的 Wilcoxon 秩 和 检验 和 Kruskal-Wallis 检验 ， 都 是 检验 两 个 
样本 的 总 体 在 位 置 上 是 否 相 等 。 

基本 思路 : 首先 将 两 组 的 样本 混合 并 按 升 序 排 序 ， 这 时 我 们 就 得 到 了 每 个 数据 在 整 
个 数据 中 的 位 置 ， 我 们 称 之 为 等 级 或 秩 。 如 果 数 据 在 总 体 数据 上 的 位 置 相同 ， 我 们 称 之 
为 结 ， 在 计算 这 样 的 数据 在 总 体 数据 中 的 位 置 时 我 们 计算 它们 的 平均 秩 。 其 次 计算 第 一 
个 样本 每 个 观察 值 的 秩 大 于 第 二 个 样本 每 个 观察 值 的 秩 的 次 数 ， 在 计算 第 二 个 样本 每 个 
观察 值 的 秩 大 于 第 一 个 样本 观察 值 的 秩 的 次 数 ， 分 别 用 U 和 U 表示 ， 如 果 Ui 和 2 比 
较 接近 ， 则 说 明 两 个 样本 来 自 于 相同 分 布 的 总 体 ， 反 之 不 是 。 

2. K-S 检 验 (Kolmogorov-Smirnov 检 验 ) 

K-S 检验 (Kolmogorov-Smimov 检验 ) 是 一 种 检验 两 组 样本 秩 分 累计 频数 和 昧 计 频 
率 的 差异 检验 。 基 本 思路 : 首先 计算 两 组 样本 的 秩 分 累计 频数 和 每 个 点 上 的 累计 频数 ， 
然后 将 两 组 的 累计 频率 相 减 ， 得 到 一 组 差 值 序列 ， 通 过 检验 该 差 值 序列 总 和 的 大 小 来 检 
验 两 个 独立 样本 分 布 是 否 有 差异 。 

3. W-W 检 验 (Wald-Wolfwitz runs 检验 ) 

W-W 检验 (Wald-Wolfwitz runs 检验 ) 是 一 种 对 两 组 样本 秩 分 别 排列 的 游程 检验 。 
两 独立 样本 的 游程 检验 和 单 样本 游程 检验 的 思想 基本 相同 ， 不 同 之 处 是 如 何 得 到 游程 数 
据 。 在 两 独立 样本 的 游程 检验 中 ， 计 算 游 程 的 方法 与 样本 观察 值 的 秩 有 关 ， 其 方法 是 将 
两 独立 样本 各 个 观察 值 依 据 其 分 组 号 分 别 用 “0” 和 “1” 进 行 编号 (用 “0” 表 示 第 一 组 ， 
用 “1” 表 示 第 二 组 ) ， 然 后 再 混合 成 一 个 样本 ， 并 按 每 个 观察 值 从 小 到 大 的 顺序 重新 
排序 ， 最 后 按 每 个 观察 值 分 组 编号 计算 游程 数 。 通 过 对 该 序列 游程 的 检验 ， 判 断 两 样 
本 是 否 来 目 同一 总 体 。 如 果 游 程 数 较 小 , 则 样本 来 自 的 两 个 总 体 的 分 布 形 态 有 较 大 差距 。 
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如 果 游 程 数 比 较 大 ， 则 可 以 认为 是 两 样本 数据 充分 混合 的 结果 ， 即 可 认为 两 样本 来 自 
同一 总 体 。 

4. 摩西 极端 反应 检验 (Moses extreme reaction ) 

摩西 极端 反应 检验 也 是 一 种 检验 样本 来 自 的 两 个 总 体 分 布 是 否 存 在 显著 差异 的 方法 。 
其 零 假设 Hu: 样本 来 自 的 两 个 总 体 分 布 无 显著 差异 。 

基本 思路 : 将 两 组 样本 混合 后 排序 ， 求 出 全 部 数据 的 秩 分 变量 ， 以 一 个 样本 为 控制 
样本 ， 另 一 个 为 试验 样本 ， 以 控制 样本 作对 照 ， 检 验 试验 样本 是 否 存在 极端 反应 。 首 先 
将 两 组 样本 混合 后 按 升序 排序 ， 然 后 找 出 控制 样本 最 低 秩 和 最 高 秩 之 间 包 含 的 观察 值 个 
数 ， 称 为 跨度 (Span) 。 为 控制 极端 值 对 分 析 结 果 的 影响 ， 也 可 以 先 去 掉 样 本 两 个 最 极 
端的 观察 值 后 再 求 路 度 。 如 果 路 度 很 小 ， 说 明 两 个 样本 无 法 充分 混合 ， 可 以 认为 试验 样 
本 存在 极端 反应 。 

1. 打开 数据 库 data01.sav; 

2. 分 析 一 非 参 数 一 旧 对 话 框 一 2 独立 样本 ; 如 图 13-11 所 示 , 将 肺 呼 量 放 入 检验 变量 ， 
分 组 变量 设置 1 和 2， 检验 类 型 选择 Mann-Whitney U 检验 。 上 点击“ 确定 ”运行 。 

3. 主要 结果 

图 13-12 (A) 为 男女 生 的 秩 均 值 ， 图 13-12 (B) 为 检验 统计 量 ，Mann-Whitney U= 
4095，Wilcoxon W45423， 其 对 应 的 2Z=-19.032，P=0.000<0.05，“ 大 同 小 异 ”， 男 女生 
的 肺 呼 量 差 异 有 统计 学 意义 ， 其 中 男生 的 均值 为 425.49， 女 生 的 均值 为 158.27， 因 此 男 
生 的 肺 呼 量 大 于 女生 。 


内 双 潮 立 样本 检验 ee z | A \ 磋 
| 位 ”不 案 政 ” 秩 平 二 值 ” 科 的 总 和 和 
TT ts 肺 呼 最 ” 男 303 425.49 128922.00 
要 287 158.27 45423.00 
总 计 590 
人 2 答 验 统计 3 
有 in 笠 讲 
2 [bsaaae | re 曼 - 囊 特 尼 U 4095.000 
Wi | 而 威 尔 科 克 森 WW 45423.000 
a 古 尔 德 - 汪 尔 福 若 深 洲 程 (WN) : 入 人 
上 潮 近 显著 性 【 双 尾 ) 0.000 


i - | 医 一 | 3. 分 组 变量 : 性 别 
图 13-11 双 独 立 样本 检验 图 13-12” 双 独 立 检 验 结 果 
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> 13.6 K 独立 样本 检验 


如 前 所 述 ， 统 计 学 存在 着 “2K 效应 ”，2 组 与 玉 组 ， 虽 然 试 验 设计 一 样 ， 但 统计 方 
法 不 一 样 。SPSS 中 给 出 三 种 玉 组 比较 的 非 参数 检验 方法 : Kruskal-Wallis H 检验 、 中 位 
数 (Median) 检验 和 Jonckheere-Terpstra 检验 。 

1. Kruskal-Wallis H 检验 

Kruskal-Wallis H 检验 为 Mann-Whitney U 检验 的 扩展 ， 用 来 检验 kk 个 独立 样本 是 否 
来 自 不 同 总 体 。 

2. Median〔 中 位 数 ) 检验 

Median《〈 中 位 数 ) 检验 用 于 检验 多 个 样本 是 否 来 自 具 有 相同 中 位 数 的 总 体 。 其 零 假 
设 是 : 样本 来 自 的 多 个 独立 总 体 的 中 位 数 无 显著 差异 。 当 个 案 具 有 很 多 相同 等 级 或 数据 
具有 二 分 特性 时 ， 用 该 检验 方法 较 合适 。 

3. Jonckheere-Terpstra 检 验 

Jonckheere-Terpstra 检验 样本 来 自 多 个 独立 总 体 的 分 布 是 否 存在 显著 差异 。 其 零 假 
设 是 : 样本 来 目的 多 个 总 体 的 分 布 无 显著 差异 。Jonckheere-Terpstra 检验 的 基本 思想 与 
Mann-Whitney U 检验 相似 ， 也 是 计算 一 组 样本 的 观测 值 小 于 其 他 组 样本 观测 值 的 个 数 。 


案例 实战 
某 医 生 分 析 三 种 药物 治疗 慢性 胃炎 疗效 是 否 有 差异 。 数 据 库 如 图 13-13 所 示 。 
案例 解析 


受 试 对 象 分 为 三 组 ， 分 别 接受 4、B、C 三 种 药物 治疗 ， 明 显 为 成 组 设计 ; 疗效 指标 
为 治愈 、 有 效 、 好 转 和 无 效 ， 为 等 级 资料 ， 可 以 采用 非 参 数 进 行 组 间 疗 效 的 比较 。 

实战 步骤 

1. 打开 数据 集 13.6.sav; 

2. 加 权 : 数据 一 个 案 加 权 ， 将 freq 放 入 加 权 框 中 ; 

3. 菜单 : 分 析 一 非 参 数 一 旧 对 话 框 一 K 个 独立 样本 检验 ， 如 图 13-14 所 示 。 将 result 
放 入 检验 变量 框 中 ， 分 组 变量 定义 1 一 3， 检 验 类 型 选择 Kruskal-Wallis H 检验 ， 点 击 “ 确 

4. 主要 结果 

13-15 (A) 显示 三 组 的 秩 均 值 ， 图 13-15 (B) 为 Kruskal-Wallis H 检验 的 卡 方 = 
61.146，P=-0.000<0.05，“ 大 同 小 异 ”， 可 认为 三 种 药物 的 疗效 存在 差异 。 正 如 方差 分 析 
一 样 ， 只 能 得 出 三 种 药物 疗效 总 体 有 差异 ， 具 体 谁 和 谁 有 差异 ， 需 要 进一步 比较 。 
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蝙 针对 多 个 独立 岸本 的 检验 

El NE Sm oroup ”不 素数 ”大 平 均值 
| | lss 3 result A 100 90.27 
大 到 本 9 [resnlt 村 日 85 162.00 
一 一 一 四 85 162.21 
| rm : 四 
Bl 1 | 
| 2 | 
一 一 一 一 |] 检验 统计 > 
I 2 | 
| : 
| | 卡 方 61 146 

| | 有 Mr | 亦 且 的 十 2 
3 | 属 克 窒 浙 卡 未 - 沃 利 白 H{K) 回 中 位 数 思 ]| Me 几 让 | 
l | 二 说 姑 小 值 (ol : 加 | 渐 近 显 阁 性 0.000 
| 3 | | 芍 殉 得 钙 - 塔 怕 荆 特 兵员 ) 本 Tt 
L ] a. 克 鲁 斯 卡尔 - 活 
| EN 人 利 斯 检验 

二 b. 分 组 变量 : 
到 入 图 | 1 | group 
图 13-13 ”数据 格式 图 13-14 独立 样本 检验 图 13-15 检验 结果 


5. 进一步 比较 

分 析 一 非 参数 一 独立 样本 ， 如 图 13-16 所 示 ， 将 result 放 入 检验 字符 ， 注 意 : 只 能 放 
入 计量 或 等 级 资料 ;， 点击“ 设置 ”， 如 图 13-17 所 示 ， 选 择 定 制 检 验 ， 并 勾 选 Kruskal- 
Wallis H 检验 成 对 比较 ， 点 击 “ 运 行 ”。 

6. 主要 结果 

首先 得 到 图 13-18，Kruskal-Wallis H 检验 结果 ， 知 PE0.000<0.05， 认 为 三 组 间 有 郑 
异 的 结论 ; 双击 该 图 标 ， 弹 出 图 13-19 所 示 结 果 ， 在 查看 处 选择 “成 对 比较 ”， 发 现 4-B 
比较 、4-C 比较 尸 值 小 于 0.05， 和 差异 有 统计 学 意义 ; B-C 比较 P=1.0>0.05， 差 异 无 统计 
学 意义 。 
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回 县 一 特 尼 U 怪 沾 树林 ) (5 


加 | 科 四 其 臣 洁 去 书 条 证 夫 (2 沾 怪 二】 户 FE 
ro 个 作 林 的 2 三 和 Wet) 地 
权 诬 有明 序 人 ) : | 县 汗 到 县 大 


站 村 入 床 区 区 本村 性 
[ 站 样 直 的 两 下 征 - 法 尔 福 医 法 村 验 一 
De ) 加 兽 重 上 向) 8 二 部 后 对 


六 在 音 个 址 之 站 Et 竹 范围 
门 其 十 很 汀 反应 12 沾 重 二) (0 y 
生计 征 侠 下 证 的 南 阁 通话 ) 重工 各 样 系 让 位 盔 医 

三 训导 十 的 下 各 芽 目 瑟 
可 币 (0 1 国 


剧 十 由 IT 
中 位 歧 上 D) : 


地 年 比 入 (出 ) : | 主 训 所 B31 


「 在 痢 十 量 之 辣 寺 耐量 唐 区 同 - = 
本 重 理 是 - 昔 爱 帖 塌 【了 十 样 幸运) 


图 13-17 独立 样本 设置 


group 的 成 对 比较 


假设 检验 汇总 : 
和 每 行 会 樟 稚 过 企 设 ;样本 | 和 梓 本 2 分布 相同 。 
进 加 车 仁 《到 侧 丛 扑 》。 驾车 和 六 于 的 005 ， 


1 人 group 类 别 上 ，result 的 分 布 相 独立 样本 
_ Wallis 检验 
显示 渐进 显著 性 。 显著 性 水 平 为 005 。 


图 13-18 ” ”Kruskal-Wallis H 检验 结果 


图 13-19 ” 非 参 数 两 两 比较 


祖 13.7 2 个 相关 标本 检验 
相关 样本 的 非 参数 检验 是 在 对 总 体 不 了 解 的 情况 下 ， 对 样本 所 在 的 相关 配对 或 配伍 
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总 体 的 分 布 是 否 存在 显著 性 差异 进行 检验 。 该 检验 一 般 应 用 于 对 同一 研究 对 象 ( 或 配对 
对 象 ) 分 别 给予 天 种 不 同 处 理 或 处 理 前 后 的 效果 进行 比较 ， 前 者 推 朵 天 种 效果 有 无 显著 
差异 , 后 者 推断 某 种 处 理 是 否 有 效 。 本 节 中 的 两 相关 样本 检验 就 是 解决 后 者 的 一 种 方法 ， 
在 下 一 节 中 我 们 将 介绍 天 个 相关 样本 检验 。 

在 SPSS 中 两 个 相关 样本 检验 的 方法 主要 有 : Wilcoxon 检验 、Sign( 符 号) 检验 、 
McNemar 检验 和 Marginal Homogeneity 检验 。 

1. Wilcoxon 检 验 

Wilcoxon 检验 也 称 为 Wilcoxon 符号 平均 秩 检验 ， 主 要 用 于 检验 两 个 相关 样本 是 否 来 
自 相 同 的 总 体 , 但 对 总 体 分 布 形 式 没有 限制 。 该 检验 方法 要 求 检 验 变 量 为 两 个 连续 变量 ， 
首先 将 一 个 样本 观测 值 减 去 另 一 个 样本 相应 的 观测 值 ， 记 下 差 值 的 符号 和 绝对 值 ， 然 后 
将 绝对 值 差 值 数据 按 升序 排序 后 ， 求 出 相应 的 秩 ; 最 后 分 别 计 算 正 值 的 秩 的 平均 秩 及 
总 和 、 负 值 的 秩 的 平均 秩 及 总 和 。 

2. Sign 检 验 

Sign 检验 又 称 符 号 检验 ,该 检验 适用 于 相关 样本 资料 和 定性 变量 , 测量 特征 是 用 正 、 
负 号 而 不 是 用 定量 测量 。 其 零 假 设 是 样本 来 自 的 两 配对 样本 对 总 体 分 布 无 显著 差异 。 

3. McNemar 检 验 

McNemar 检验 ， 又 称 变量 显著 性 检验 。 该 检验 将 研究 对 象 上 自身 作为 对 照 , 检验 其 “前 
后 ”变化 是 否 有 显著 差异 。 其 堆 假 设 是 样本 来 自 的 两 配对 总 体 分 布 无 显著 差异 。 该 检验 
要 求 数 据 是 二 分 类 的 ， 基 本 方法 采用 二 项 分 布 检验 ， 统 计量 为 x 。 

4. Marginal Homogeneity 检 验 

Marginal Homogeneity 检验 ， 又 称 边际 同 质 性 检验 ， 是 McNemar 检验 从 二 分 类 事件 
加 多 分 类 事件 的 推广 。 方 法 是 用 X 检验 事件 发 生前 后 观测 数据 的 变化 。 

一 般 情况 下 ，Wilcomxon 检验 和 符号 检验 用 于 检验 两 个 配对 样本 是 人 否 来 自 相 同 的 总 
体 ; McNemar 变化 显著 性 用 于 进行 二 分 类 变量 ; 边际 同 质 性 检验 用 于 定 序 变 量 的 检验 。 

案例 实战 

某 市 环保 局 采用 新 旧 两 种 方法 对 室内 10 个 监测 点 空气 进行 检测 ， 问 新 旧 方 法 检测 结 


本 例 室 内 10 个 监测 点 ， 采 用 了 2 种 方法 检测 ， 属 于 对 同一 对 象 采用 不 同 检测 方法 的 
配对 设计 ; 如 果 差 值 符合 正 态 分 布 ,优先 考虑 配对 样本 上 检验 。 非 参数 检验 使 用 范围 更 三 ， 
本 例 采 用 相关 样本 的 非 参 数 检验 进行 分 析 。 
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1. 打开 数据 集 13.7.sav; 
2. 分 析 一 非 参 数 一 旧 对 话 框 一 2 个 相关 样本 ， 如 图 13-20 所 示 。 将 新 旧 方 法 放 入 到 检 
验 对 框 ， 选 择 Wilcoxon 检验， 点击“ 确定” 运行 。 
3. 主要 结果 : 如 图 13-21 所 示 。Wilcoxon 和 从 号 检验 秩 检验 ，2Z=-0.816，P=-0.415>0.05， 
“大 同 小 异 ”， 认 为 老 方法 和 新 方法 检测 的 结果 没有 差别 。 


小 于 0.05， 其 意义 主要 看 研究 目的 ， 对 于 本 例 ，P>0.05 就 是 非 第 好 的 一 件 事情 ， 因 为 两 
者 没 差 寞 ， 所 以 我 们 就 可 以 用 新 的 方法 代 蔡 老 的 方法 是， 是 不 是 呢 ? 


倪 样 本 号 INOI 


检验 统计 ” 
新 方法 - 老 方法 
过 -0.816 
渐 折 显 着 性 ( 双 尾 ) 0.415 
Ce 2 、 
一 b. 基于 正 秩 
13-20” 头 联 非 参数 检验 13-21 ”比较 结果 


> 13.8 KK 个 相 天 样本 检验 


SPSS 中 天 个 相关 样本 采用 了 3 种 检验 方法 : 

1. Friedman: 单 样本 重复 测量 或 配伍 组 设计 定量 或 等 级 资料 的 一 种 非 参数 检验 方法 。 
对 于 配伍 组 设计 ， 需 要 进行 两 次 Friedman 检验 ， 可 以 通过 转 置 功能 实现 数据 转化 。 

2 Kendalls W: 和 谐 系 数 检验 ， 取 值 在 0 和 1 之 间 ， 用 来 量度 不 同 评判 者 之 间 的 一 

3. Cochran’s Q 检验 : 是 Friedman 检验 在 所 有 反应 变量 均 为 二 分 类 结果 时 的 一 个 特例 ， 
也 是 McNemar 检验 在 多 个 样本 情况 下 的 推广 。 

案例 实战 

某 医生 采用 中 药 治 疗 10 名 某 病 患者 ， 于 治疗 前 、 中 、 后 3 次 检测 每 名 患者 的 功能 评 


| 第 13 章 非 参 数 检验 | 217 


分 ， 数 据 如 图 13-22。 试 分 析 治 疗 前 、 中 、 后 功能 评分 是 
否 存 在 差异 。 

案例 解析 

大 家 看 到 本 例 ， 应 该 立马 想到 重复 测量 数据 的 方差 分 
析 ， 因 为 只 有 一 组 ， 因 此 为 单 组 重复 测量 数据 方差 分 析 ; 
而 单 组 重复 测量 方差 分 析 ， 在 球 对 称 性 满足 的 情况 下 ， 也 


可 以 采用 随机 区 组 设计 的 方差 分 析 ; 当然 也 可 以 用 天 个 相 “| os.e0 | 

关 样 本 的 非 参数 检验 进行 分 析 。 ae 
实战 步骤 Se 
1. 打开 数据 集 13.8.sav; 图 13-22 ”数据 格式 


2. 分 析 一 非 参数 一 玉 个 相关 样本 ， 如 图 13-23 所 示 ， 将 三 次 检测 放 入 检验 变量 框 ， 
人 Friedman 检验 ， 点 击 “ 硼 定 ” 运 和 


图 13-24 可 知 Friedman 卡 方 =15.8，P=0.000<0.05， 认 为 三 次 检测 结果 存在 差异 ， 
同样 我 们 不 知道 谁 和 谁 存在 差异 。 


检验 统计 ” 
个 案 数 10 
长 六 15.800 
目 由 度 2 
渐 近 显 若 性 0.000 
a. 售 莱 和 神 曼 检验 


图 13-23 多 个 相关 样本 非 参 数 图 13-24 ”运行 结果 


4. 进一步 比较 

分 析 一 非 参数 一 相关 样本 ， 如 图 13-25 所 示 ， 将 三 次 检测 结果 放 入 检验 字段 框 中 ， 
凡 击 “设置 ”， 如 图 13-26 所 示 ， 选 择 “ 定 制 分析 ”， 选 择 “ 比 较 分 布 ”，Friedman 成 
对 比较 ， 点 击 “ 确 定 ” 运 行 
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上 加 中 入 小 壮 基 iD 职 设 中 垃 各 区 作 
EE | i 


四 | 要 训 尼 马 币 糙 驴 (2 小 入 率 】Ni 加 乔 晤 品 驴 412 十 本 束 ) 妈 ] 
回 开外 击 训 入 区 本 对 符号 秩 档 及 (和 小 样本 】》r 
导 直 置信 区 同 


di 


加 罩 音 十- 昔 昌 【2 个 样 让) EDI 
-量化 党 了 


因 向 训 营 业 粒 幅 {EK 十 怪 下 》 


加 睛 翘 汞 协同 他 有 地 副 [区 小 幸村 ] 


图 13-25 “” 非 参数 新 对 话 框 图 13-26 设置 选择 
假如 检验 汇总 


是 治疗 前 , 治疗 中 and 治疗 后 的 分 布 车 mu 入 从 的 0000 i 
人 双向 广 a 


图 13-27 检验 结果 
5. 主要 结果 
由 图 13-27 知 Friedman 检验 ，P=0.000<0.05， 三 次 检测 结果 差异 有 统计 学 意义 。 双 击 
该 图 ， 弹 出 图 13-28。 选 择 成 对 比较 ， 得 两 两 比较 结果 ， 治 疗 前 治疗 中 一 治疗 
后 差异 P<0.05， 治疗 中 ，P=1.0>0.05, 差异 无 统计 学 意义 。 
SPSS 此 处 有 bug， 三 者 间 缺 了 一 条 线 。 


成 对 比较 每 个 记 点 显示 样本 平均 秩 。 


党 生 全 钳 上 兮 “全 计 人 会 显 苦 隆 合 调 爱 中 著作 
治疗 前 -治疗 中 -0.400 0.447 -0.894 0371 
| 


-1.300 D447 -4.907 UUU4 | 


等 于 RT li 
显示 人 全 管内) * 显著 和 性 水 平 为 D006， 
Benferoni 校正 已 科 对 多 个 检验 调整 显著 性 值 


宗 段 ; 加 | 治疗 前 ,治疗 中 ,治疗 后 【检验 人 ) 加 


四 13-28 两 两 比较 的 结果 


> 13.9 非 参数 检验 和 人 参数 检验 


参数 检验 和 非 参数 检验 共同 构成 差异 性 统计 分 析 的 内 容 。 参 数 检验 往往 对 总 体 参数 
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有 一 定 的 假定 ， 如 前 述 的 上 检验 、 环 检验 :这些 检 验 都 假设 样本 来 目 于 正 态 分 布 的 总 体 ， 

将 总 体 的 数字 特征 看 做 未 知 的 “参数 ”， 通 过 样本 的 数据 特征 对 其 总 体 进行 统计 推 朵 。 

然而 在 实际 研究 中 ,很 多 情况 下 ， 数 据 并 不 满足 参数 检验 的 条 件 ， 非 参数 检验 应 运 而 生 。 

非 参 数 检验 适用 的 范围 很 广 ， 对 资料 没有 要 求 ， 对 总 体 分 布 几乎 没有 什么 假定 ， 只 是 有 
时 对 分 布 的 形状 做 一 些 诸 如 连续 、 对 称 等 的 简单 假设 。 


13.9.1 ” 非 参 数 检 验 的 优点 


相对 于 参数 检验 ， 非 参数 检验 有 以 下 优点 : 

(1) 对 数据 的 要 求 不 严格 ， 对 资料 的 分 布 类 型 要 求 比较 宽松 。 
(2) 检验 方法 灵活 ， 使 用 的 范围 广泛 。 

(3) 非 参数 检验 的 计算 相对 简单 ， 易 于 理解 和 掌握 。 


13.9.2” 非 参 效 检验 的 缺点 


任何 检验 方法 都 有 其 优点 和 缺点 ， 非 参数 检验 也 不 例外 。 

(1) 非 参数 检验 方法 对 总 体 要求 不 局 ， 适 用 于 任何 分 布 类 型 的 资料 ， 但 其 方法 本 身 
缺乏 针对 性 ， 当 资料 满足 参数 检验 的 条 件 时 ， 使 用 非 参数 检验 会 大 大 降低 检验 的 功效 。 

(2) 非 参数 检验 的 方法 简单 ， 主 要 使 用 等 级 或 符号 秩 ， 而 不 是 使 用 资料 提供 的 原始 
数据 ， 因 此 降低 了 原始 信息 的 使 用 率 ， 其 检验 的 有 效 性 也 就 比较 差 了 。 


13.9.3 ”两 种 检验 的 选择 与 效 度 


(1) 如 果 资 料 符 合 参数 检验 的 条 件 ， 当 然 优 先 选择 参数 检验 ， 当 条 件 不 符合 时 才 采 
用 非 参 数 检 验 ; 

(2) 如 果 资 料 采 用 非 参 数 检验 , 可 以 得 到 P<0.05, 那么 当 资 料 符合 参数 检验 的 条 件 时 ， 
参数 检验 的 尸 肯定 小 于 0.05; 若非 参数 户 0.05， 此 时 参数 检验 的 尸 值 不 一 定 大 于 0.05， 
也 有 可 能 小 于 0.05。 举 个 例子 ， 参 数 检验 就 是 CT， 非 参数 就 是 义 胸 片 。 

(3) 非 参 数 检验 由 于 没有 利用 数据 的 具体 数值 信息 ， 只 利用 了 其 位 次 信息 ， 因 此 ， 
非 参数 检验 的 效 度 没 有 参数 检验 高 。 

(4) 很 多 人 采用 非 参 数 ， 得 到 P<0.05， 发 文章 不 愿意 说 是 非 参数 检验 的 结果 ， 人 怕 
审阅 者 说 数据 质量 不 高 ， 其 实 大 可 不 必 ， 非 参数 也 是 一 种 很 好 的 检验 方法 ; 如 果 非 参数 
P>0.05, 此 时 反而 不 太 好 解释 , 因为 很 可 能 是 数据 的 问题 , 导致 其 中 的 差异 并 未 能 被 发 现 。 


今 > 第 14 章 多 元 方差 分 析 


前 面 章节 我 们 研究 的 都 是 结果 变量 〈 因 变量 ) 是 一 个 的 情况 ， 然 而 当 一 个 观察 单位 
的 观测 指标 〈 因 变量 ) 有 多 个 ， 且 各 指标 间 又 往往 相互 联系 、 互 相 影 响 时 ， 如 果 此 时 采 
用 多 次 单 变 量 分 析 , 无 疑 会 增 大 I 类 错误 , 并 当 单 变量 结果 不 一 致 时 ,很 难 做 出 正确 的 判断 ， 
此 时 我 们 应 该 采用 多 变量 分 析 。 


> 


9 身高 | 体重 | 胸围 | 条 例 实 成 

;1710 890710 菜 高 校 随 机 抽取 了 20 名 大 学 生 ， 调 查 其 身高 、 体 重 和 有 
1740 500 790 围 指 标 ， 数 据 见 图 14-1。15 年 前 该 校 大 学 生 的 身高 、 体 重 、 
5 1630 ”590 ”830 胸围 的 均值 分 别 为 : 168.3cm、50.5kg、78.2cm。 试 问 ， 本 次 调 
六 -70062080 查 结果 与 15 年 前 结果 是 否 相 同 ? 
8 1710 660 820 实战 步 又 
9 | | 
1750 ， 650 | 850 首先 将 调查 数据 构建 为 图 14-1 所 示 格 式 SPSS 数据 文件 。 
oT ro | non 1. 计算 3 个 差 值 变量 ， 选 择 菜 单 Transform 一 Compute 
1 = 2 variable， 在 弹出 的 Compute variable 对 话 框 中 ， 分 别 计算 产生 
1770 ”630 820 | 身高 1、 体 重 1 和 胸围 1 变量 , 表达 式 分 别 为 映 高 1 = 身高 -168.3、 
1610 ”500 ”810 体重 1= 体重 -50.5、 胸 围 1= 胸围 -78.2。 其 中 身高 1 计算 产生 
18 1780 ”640 | 870 如 图 142 所 示 ， 体重 1 和 胸围 1 产生 图 略 。 


1 19 1670 630 86.0 


| 
= n= 扣 
一 
~ 
Cn 
| 
oh 
| 
Li 
CD 
| 
| 


| 20 ， 1770 570 | 800 2 进行 单 组 多 变量 分 析 
14-1 数据 文件 选择 菜单 Analyze 一 General Linear Model 一 Multivariate( 多 


变量 ) ， 弹 出 Multivariate 对 话 框 ， 将 身高 1、 体 重 1 和 胸围 ] 移入 Dependent Variables 
( 因 变 量 ) 框 中 ， 如 图 14-3， 点 击 “Options( 选 项) ”按钮 ， 弹 出 框 中 色 选 “Descriptive 
statistics”【〔 描 述 统 计量 ) 后 ， 点 击 “continue” 返 回 主 对 话 框 ， 单 击 “OK” 。 
运行 结果 如 图 14-4、 图 14-5、 图 14-6 所 示 ， 图 14-4 给 出 身高 1、 体 重 1 和 胸围 ] 的 
样本 量 、 均 数 与 标准 差 ， 图 14-5 给 出 4 种 方法 Pillai’s Trace、Wilks’ Lambda、Hotelling’s 
Trace 和 Roy’s Largest Root 计算 统计 量 互 值 ， 以 及 对 应 的 尸 值 ， 结 果 可 见 4 种 结果 的 己 
值 均 小 于 0.01， 可 以 认为 该 校 大 学 生 的 身体 状况 与 15 年 前 差异 有 统计 学 意义 ， 进 一 步 结 
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合 图 14-4， 可 以 得 出 该 校 大 学 生 的 身体 状况 优 于 15 年 前 的 结论 。 图 14-6 进一步 对 身高 1、 
体重 1 和 胸围 1 三 个 指标 进行 了 比较 ， 结 果 发 现 三 者 的 P 值 均 小 于 0.01， 因 此 三 个 指标 
均 优 于 15 年 前 。 


Compute Yariable | IlItrwariate 


Targal warlable: Numeric Expressionm: 


Functian group: | EJ 胸围 
Fixed Factor(sy 


Covariaters. 


WLS Weight: 
rm | 国 [ 
CoO) Es) Ee Ge Le 


图 14-2 身高 1 变量 计算 图 示 图 14.3 Multivariate 对 话 框 设置 


Miultivariate Testsb 
Effect ralue Hvpothesls oe -FOr 
Descriptive Statistics Intercept Pillai's Trace 775 19.497a 3000 17.000 
Wiilks' Lambda 229 19.4973 3.000 17.000 
"00 70 Hotelling's Trace 19,.49r7a 3.000 17.000 
体重 1 i a a Roys Largest Root 19.497a 3.000 17.000 
胸围 1 5.2250 3.80192 20 et 


图 14-4 三 个 变量 的 简单 统计 描述 14-5 多 变量 4 种 检验 结果 


Tests of Between-Subjects Effects 


Type lll Sum 

Source Dependent variable of Squares df Mean Square F Sig. 
Corrected Model ”身高 1 .000a 0 

体重 1 .000° 0 

胸围 1 .000s 0 ; 
Intercept 身高 1 26B6.450 1 266.450 11.693 ‘003 

体重 1 1767.20D0 1 176r.200 sg .gd2r 000 

胸围 1 546.012 1 546.012 a7.774 ‘D000 
Error 身高 1 432.950 19 22.787 

体重 1 569.800 19 29.989 

胸围 1 274.638 19 14.455 
Total 身高 1 B99.400 20 

体重 1 2337.000 20 

胸围 1 920.650 20 
Corrected Total 身高 1 432.950 19 

体重 1 569.800 19 

胸围 1 274.638 19 


a.R Squared= .000 rAdjusted R Squared = .000m 


图 14-6 效应 分 析 
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> 14.2 两 组 比较 


案例 实战 

某 高 校 随机 抽取 了 10 名 男 大 学 生 与 10 名 女 大 学 生 ， 测 得 其 身高 、 体 重 和 胸围 指标 ， 
数据 见 图 14-7。 问 男女 生 间 和 号 体 测 量 指标 间 有 无 差异 。 

首先 将 调查 数据 构建 为 图 14-7 格式 SPSS 数据 文件 。 

选择 菜单 Analyze 一 General Linear Model 一 Multivariate， 弹 出 Multivariate 对 话 框 ， 
将 和 喘 高、 体重 和 胸围 放 入 Dependent Variables( 因 变量 ) 杠 中, 将 性 别 放 入 Fixed Factor(s)( 固 
定 因子 ) ， 如 图 14-8， 点 击 “Options( 选 项 ) ”按钮 ， 弹 出 框 中 勾 选 “Descriptive statistics〈 描 
述 统计 量 ) ”, 将 性 别 移入 display means for 框 中 , 点 击 “continue” 返 回 主 对 话 框 , 单 击 “OK”。 


性 别 | 身高 | 体重 | 网 围 | 「 彤 Multivariate 
1681.0 50.0 81.0 
174.0 J0.0 79.0 
171.0 52.0 80.0 


Dependent Variables: 


169.0 58.0 83.5 Fixed Factor(s) 


1710 | 580 | 770 加 


Covariate(s) 


= 
mk 
=—s) 
本 
[mm 
局 
i 
rm | 
Ca 
[sw 
[mi] 


14-7 数据 文件 14-8 ”多 变量 框 设置 


结果 解释 如 图 14-9， 图 14-10 和 图 14-11。 图 14-9 为 不 同性 别 身高 、 体 重 和 胸围 的 
3 个 基本 统计 量 描述 。 图 14-10 为 采用 Pillai’s Trace、Wilks” Lambda、Hotelling’s Trace 
和 Roy’s Largest Root 计算 的 统计 量 F 值 ， 以 及 对 应 的 P 值 ， 本 例 为 两 组 间 比 较 ， 应 该 看 
Hotelling's Trace 的 结果 ，F=22214.354”，PP 值 小 于 0.01， 结 果 显 示 不 同性 别 的 身高 、 体 
中 14-11 为 不 同性 别 间 的 身高 、 体 重 和 胸围 进行 比较 ， 结 果 显 
示 不 同性 别 的 身高 存在 差异 CP<0.05) ， 体 重 〈P=0.071) 和 胸围 CP-0.376) 差异 无 统 
计 学 意义 。 注 意 多 变量 2 组 间 比 较 应 该 采用 Hotelling's T 检验 ， 本 模块 中 无 Hotelling’s 
T 检验 ， 因 为 多 变量 方差 分 析 可 用 于 多 组 或 两 组 间 的 比较 ， 用 于 两 组 时 Hotelling's Trace 
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与 Hotelling T 检验 等 价 。Hotelling's Tracex (mn- 组 数 ) =HotellingT 统计 量 。 


体重 


胸围 


图 14-9 不 同性 别 三 项 指标 统计 描述 


Descriptive Statistics 
性 别 | Mean Std. Deviation 
区 168.300 3.5606 
男 175.600 2.4129 
Total 171.950 4.7736 
57.700 5.1001 
里 62.100 5.1521 
Total 59.900 5.4763 
鼠 82.650 3.9303 
男 84.200 3.7059 
Total 83.425 3.8019 


Source 
Corrected Model 


Intercept 


性 别 


Error 


Total 


Corrected Total 


Dependent variable 


身高 
体重 
胸围 
身高 
体 事 
胸围 
身高 
体重 
胸围 
身高 
体重 
胸围 
身高 
体重 
胸围 
身高 
体重 
胸围 


10 
10 
20 
10 
10 
20 
10 
10 
20 


Multivariate Testsb 

Efect Value FF Hypothesis df Errordf Sig 
Intercept Pillai'sTrace 1000 22214354 3000 16000 0000 

Wilks'Lambda 0.000 22214.3543 3000 16.000 0.000 

Hotelling's Trace 4165.191 22214.3543 3000 16.000 0.000 

Rows LargestRoot 4165.191 22214.3543 3.000 16.000 0.000 

性 别 Pillai's Trace 0.620 8.720a 3.000 16.000 0001 

Vilks' Lambda 0.380 8.720a 3.000 16.000 0001 

Hotelling's Trace 1.635 8.720a 3000 16.000 0001 

Rows Largest Root 1.635 8.720a 3.000 16.000 0001 


a. Exact statistic 
b. Design: Intercept + 性 别 | 


图 14-10 不 同性 别 三 项 指标 的 多 变量 检验 


Type ll|l Sum 
of Squares df 


266.4503 
g6.900° 
12.012° 

591336.050 
71760.200 
139194.613 
266.450 
96.800 
12.013 
166.500 
473.000 
262.625 
591769.000 
72330.000 
139469.250 
432.950 
569.800 
274.637 


Squared =0.615 rAdjusted R Squared =0.59) 


图 14-11 


> 14.3 多 组 比较 


a. R 
b.R Squared =0.170 二 可 Usted R Squared =0.12) 
tc.R Squared=0.044 Adjusted R Squared =-0.009) 


Tests of Between-Subjects Effects 


不 同性 别 三 项 指标 的 单 变量 检验 


Mean Square F 
266.450 28.805 
96.800 3.684 
12.012 0.823 
591336.050 63928.222 
71760.200 2730.832 
139194.613 9540.230 
266.450 28.805 
96.800 3.684 
12.013 0.823 
9.250 
26.278 
14.590 


案例 实战 


三 个 地 区 大 学 生体 检 ， 测 得 身高 、 体 重 和 胸围 三 项 指标 ， 数 据 见 图 14-12， 问 三 个 地 
区 大 学 生体 格 指标 有 无 差异 ? 
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| 地 区 | 身高 | 体重 | 胸围 | 
1 1561 0 500 a10 
1 171.0 2 0 日 0 .0 
1 1700 530 7190 
1 170.0 80 g10 
1 189.0 80 6835 
1 1710 80 TY 
1 183.0 dg0 昌吉 
2 1700 日 之 站 B40 
2 167.0 63.0 器 6 0 
2 1710 He 0 B20 
过 174.0 500 179.0 
3 177.0 70 300 
3 172.0 p20 a70 
3 173.0 B2.0 82.0 
3 177.0 630 20 
地 178.0 B64 .0 87.0 
号 18D0DDO 日 直属 880 
3 175.0 65.0 日 5 0 
3 1750 B80 日 之 站 
3 1750 日 8 0 yg00 


图 14-12 数据 文件 


本] Iwlultrwarlate 


图 14-13 多 变量 框 设 置 图 14-14 


实战 步 又 


首先 将 调查 数据 文件 构建 为 图 14-12 格式 SPSS 数据 文件 。 

选择 菜单 Analyze 一 General Linear Model 一 Multivariate( 多 变 
量 ) ， 弹 出 Multivariate 对 话 框 ， 将 身高 、 体 重 和 胸围 放 入 Dependent 
Variables( 因 变量 ) 框 中 ， 将 地 区 放 入 Fixed Factor (s) (固定 因 
子 ) ， 如 图 14-13 所 示 ， 扣 击 “Options (选项 ) ”按钮 ， 将 地 区 移 
入 display means for 框 中 ， 并 勾 选 compare main effects， 下 面 display 
(显示 ) 框 勾 选 Descriptive statistics( 搓 述 统 计量 )、SSCP Matrices ( 协 
方差 矩阵 ) 和 Homogeneity tests (方差 同 质 性 检验 ) ， 点 击 “continue” 


返回 主 对 话 框 ， 单 击 “OK”。 


结果 如 图 14-15 至 图 14-20 所 示 。 图 14-15 为 三 项 指标 不 同 地 区 
的 统计 描述 ， 图 14-16 为 协 方差 是 否 相 等 检验 ，P=0.292， 认 为 多 组 间 协 方差 相等 。 


Estimated Marginal Means 


Factorts) and Factor Interactions: 


地 区 


DependentVariables. 


pm | 


Fiwed FactortsY Post Hoc... 
gave ee 
[bj Descrptive statistics 
ee Estimates of effect size 
Covarlatersy SB Bw Obsemed power 
器 Parameter estimates 
SSCP matrices 
Residual SSCP matrix 
WLS Weight 


Display Means for: 


地 区 


Transformation matrix 

贺 Homogeneit tests 

加 Spreadws. level plot 

加 Resldual plat 

Lack of fit 

General estimable function 


Significance level: Confidence intervals are 95.0% 


pa Ce 
选项 框 设置 


14-17 为 不 同 地 区 三 项 指标 多 变量 检验 结果 ， 发 现 四 种 检验 的 尸 值 均 小 于 0.05， 
认为 不 同 地 区 三 项 指标 差异 有 统计 学 意义 。 图 14-18 为 三 项 指标 身高 、 体 重 和 胸围 的 方 
差 齐 性 检验 ， 本 例 书 均 大 于 0.05， 方 差 齐 ， 适 合 做 方差 分 析 。 

14-19 为 不 同 组 别 间 单 变量 检验 结果 ， 结 果 显 示 不 同 地 区 身高 (P=0.008<0.05) 和 
体重 (P=0.001<0.05〉 差异 有 统计 学 意义 ， 不 同 地 区 间 胸 围 差 异 无 统计 学 意义 CP=0.173> 


0.05) 。 


Effect 
Intercept 


地 区 


Fillai's Trate 
vilks' Lambda 


Hotellings Trace 
Rov's Largest Root 


Fillai's Trate 
vilks' Lambda 


Hotellings Trace 
Rov's Largest Root 


a. Exact statistic 


b. The statistic is an ypperf bound on F that yields a lower bound on the significance level. 


c. Desighn: lntercept + 


图 14-17 不 同 地 区 多 变量 检验 结果 14- 
Tests of Between-Subjects Effects 
Type ll Sum 
S30urce Depeandent variable of SquUares df Maean Square 
Corrected Model ”身高 188.4083 2 94.204 
体重 327.300 2 163.650 
胸围 S51.221° 2 25.610 
Intercept 身高 577830.307 1 577830.307 
坷 重 69323.045 1 69323.045 
胸围 135954.852 1 135954.852 
地 区 身高 188.408 2 94.204 
体重 327.300 2 163.650 
胸围 51.221 2 25.610 
Error 身高 244.542 17 14.385 
体重 242.500 17 14.265 
胸围 223.417 17 13.142 
Total 身高 591769.000 20 
仁和 草 72330.000 20 
胸围 139469.250 20 
Corrected Total 。 身高 432.950 19 
体 草 569.800 19 
胸围 J.B37 19 


性 重 


胸围 


图 14-15 不 同 地 区 三 项 指标 统计 描述 


Multrvariate Tests" 
walue F Hypothesis df Error df Sig. 

1.000 17196.645a 3.000 15.000 0.000 F of 
D000 17196.6459 3.000 15.000 0.000 

3439.329 17196.645a 3.000 15.000 0.000 上 册 疝 0.862 

3439.329 17196.645a 3.000 15.000 0.000 体重 7 910 
0.767 3.317 6.000 32.000 0.012 
0.288 4.3243 6.000 30.000 0.003 胸围 .41» 
2.289 5.340 6.000 28.000 0.001 
2.203 11.74Bb 3.000 16.000 0.000 


地 区 
A 地区 
8B 地 区 
C 地 区 
Total 
上 A 区 
B 地 区 
C 地 区 
Total 
A 地区 
8B 地 区 
Cc 地 区 
Total 


Descriptive Statistics 
hiean otd. Deviation 
168.667 3.8297 
170.333 4.9666 
175.625 2.6152 
171.950 4.7736 
54.500 3.3317 
59.500 5 6125 
64.250 2.0529 
59.900 5.4763 
81.917 结 . 昌 39 
82.333 2.5820 
85.375 3.1139 
83.425 3.8019 


20 
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Box's Test of 
Edquality of 
Cowvariance 
atriceS= 


Box's hl 19.460 
F 1.180 
dfil 12 
df2 1161.917 
olg. U.292 


Tests the null 
hypothesis that 
the observed 
COvwAariance 
matrices of the 
dependent 
yatiables are 
BUAal across 
droups. 


a. Design: 
Intercept + 扩 B 攻 


JUUPsS， 


18 


a. R Squared=0.435 Adjusted R Squared = 0.369 
bh.R Squared =0574 1Adiusted R Squared= 0.524) 
tc.R equared=0187 tAdjusted R squared= 0.091) 


图 14-19 不 同 组 别 间 单 变量 检验 结果 


F 
6.549 
11.472 

1 .94 日 
40169.495 
4859.760 
10344.942 
6.549 
11.472 
1.949 


图 14-16 协 方差 齐 性 检验 


Levene's Test of Equality of Error Variancess 


df2 Sig. 
2 17 0.440 
2 17 UUss 
+ 1 0.419 


Tests the null hypothesis thatthe error variance 
ofthe dependent variable is equal across 


a. Design: Intercept + 地 区 


三 指标 方差 齐 性 检验 
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Pairwise Comparisons 
q5% Gonfidence Interval for 
Differences 


Mean 
Difference 1- 


Dependent Yariable 。 避 地 区 下地 区 山 Std. Error 3ig.3 Lower Bound Upper Bound 
身高 A 地 区 ”BB 地 区 -1.667 2.190 0.457 -6.287 2.953 
C 地 区 -6.959 2.048 0.003 -11.280 -2.637 

B 地 区 A 地 区 1.667 2.190 0.457 -2.953 6.287 

C 地 区 -5.292 2.048 0.019 -9.613 -0.970 

CC 地区。 A 地 区 6.958 2.048 0.003 2.637 11.280 

B 地 区 5.292 2.048 0.019 0.970 9.613 

体重 站 地 区 ”EB 地 区 -5.000 2.181 0.035 -9.601 -0.399 
C 地 区 -9.750 2.040 0.000 -14.053 -5.447 

EB 地 区 A 地 区 5.000 2.181 0.035 0.399 9.601 

C 地 区 -4.750" 2.040 0.032 -9.053 -D0.447 

Cc 地 区 Ae 区 9.750 2.040 0000 5.447 14.053 

B 地 区 4.750" 2.040 0.032 0.447 9.053 

胸围 Ah 地 区 ”8 地 区 -0.417 2.093 0.845 -4.833 3.999 
C 地 区 -3.458 1.958 0.095 -7.589 0.672 

B 地 区 2 地 区 0.417 2.093 0.845 -3.999 4.833 

C 地 区 -3.042 1.958 0.139 -7.172 1.089 

C 地 区 A 地 区 3.458 1.958 0.095 -0.672 7.589 

B 地 区 3.042 1.958 0.139 -1.089 7.172 


Based on estimated maryinal means 


a.Adjustrmentfor rnultiple comparisons: Least Significant Difference requivalentto no adjustrments). 
= The mean difference is significant atthe 0.05 level. 


14-20 采用 LSD 法 对 身高 、 体 重 和 胸围 进行 不 同 地 区 间 的 两 两 比较 ， 结 果 与 多 变 


图 14-20 三 指标 两 两 比较 的 结果 


量 结果 一 致 。 结 合 图 14-15， 可 以 得 出 各 指标 间 的 具体 比较 关系 。 


轮廓 分 析 是 比较 两 组 或 多 组 多 变量 均 数 向 量 的 轮廓 是 否 相 等 的 。m 个 变量 可 以 是 统 
量 结 果 ， 也 可 以 是 m 次 处 理 的 观察 结果 ， 但 m 次 处 理 的 观察 结果 
必须 属于 同一 类型 的 指标 且 计 量 单位 相同 ， 轮 廓 分 析 可 以 细 分 为 平行 轮廓 、 重 合 轮廓 与 
水 平 轮 廓 ， 下 面 用 案例 进行 人 


一 处 理 的 m 次 重复 测 


案例 实战 


为 比较 两 个 产地 茶 中 草药 的 有 效 成 分 ， 对 两 产地 中 草药 各 随机 抽取 10 份 标本 进行 5 


> 14.4 轮廓 分 析 


a 读 ，。 


种 有 效 成 分 检测 ， 数 据 如 图 14-21 所 示 ， 请 问 两 产地 中 草药 成 分 有 无 差异 ? 


自 先 构建 图 14-21 的 SPSS 数据 文件 。 
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ig] x | 2 | x» | x | x | 


1 0.0016 0.0013 0.0012 0.1560 0.2163 
1 0.0026 0.0021 0.0004 0.0021 0.2012 
1 0.0016 0.0016 0.0015 0.0032 0.2110 
1 00042 0.0038 0 .0022 0 .0830 0 3750 
1 0.0012 0.0011 0.0001 0.1400 0.2103 
1 0.0030 0.0039 0.0026 0.1190 0.1130 
1 0.0042 0.0052 0.0095 0.1640 0.3109 
1 0.0026 0.0054 0.0163 0.0780 0.2021 
1 0.0024 0.0021 0.0015 0 .2010 0 .2132 
1 0.0040 0.0032 0.0025 0.1120 0.2020 
2 0.0990 0.0830 0.0750 0.0690 0.2080 
2 0 1740 0.1400 0 0290 0 1350 0.19860 
2 0.1150 0.1190 0.1130 0.1498 0.1560 
2 01830 0.1640 00940 0.1430 1.1660 
2 0.0870 0.0780 0.0080 0.0750 0.4350 
2 0.1540 0.2010 0.1320 0.3860 1.0510 
2 00890 0 1120 0 2020 0 7889 0.4600 
2 0.0340 0.0690 0.2080 0.8610 0.6569 
2 0.1520 0.1350 0.0960 0.2630 0.7710 
2 02420 0.1980 0.1560 0.2610 1.1900 
14-21 数据 文件 


1. 选择 六 蛙 Analyze 一 General Linear Model 一 Repeated Measures， 弹出 Repeated 
Measures Define Factor (s) (重复 度量 定义 因子 ) 对 话 框 ， 如 图 14-22 所 示 ， 因 为 本 
例 有 5 次 测量 ， 因 此 在 numbers of levels 框 中 输入 5， 点 击 Add 按钮 ， 然 后 点 击 左 下 角 


Define (定义 ) 按钮 ， 弹 出 Repeated Measures 对 话 框 ， 如 图 14-23 所 示 。 


Within-Subject Factor Name: 


Number of Levels: ls | 


Add | 


Change | 


Measure Name: Between-Subjects Factor(s). 


卉 广 地 
sa | | 
Change | : Covariates: 


Re move | 


Gemne) (Rese) [Canes] [rep] 
图 14-22 重复 度量 定义 因子 框 


2. 在 图 14-23 框 中 ， 将 xl-xs 选中 ， 放 入 右 侧 within-subjects variables (factor1) 〈 主 
体内 变量 ) 框 中 。 “产地 ” 放 入 Between subjects factors 〈 主 体 间 变量 ) 框 中 。 
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3. 点 击 Plots 按钮 ， 将 Factorl 放 入 Horizontal Axis 框 中 ， 将 “产地 ” 放 入 separate 
lines 框 中 ， 点 击 “Add”， 再 点 击 “Continue”， 返 回 主 对 话 框 ， 点 击 “OK” 。 

(1) 平行 轮廓 检验 : 结果 如 图 14-24 所 示 ， 选 择 “Multivariate Test” 中 factorl* 产地 ， 
三 2.899 ，P-0.058， 可 以 认为 两 总 体 的 轮廓 相互 平行 。 即 两 种 产地 的 调查 结 朱 轮廓 基本 
相同 。 


Multivariate Testsb 


Erect value 上 Hypothesis df Errordf 59g 
Wilks' Lambda DJ.192 16.806° 4.000 15.000 0.000 
Hotelling's Trace 4.482 16.8063 4.000 15.000 0.000 
Roys Largest Root 4.482 16.806a3 4.000 15.000 0.000 
factorl * 站 地 Pillai's Trace 0.436 2.899” 4.000 15.000 0.058 
Wilks' Lambda 0.564 2.899a 4.000 15.000 0.058 
Hotellings Trace DQ.7 73 2.98993 4.000 15.000 U.058 
Rovy's Largest Root 0.773 2.999a 4.000 15.000 0.058 


a. Exact statistic 
日. Design: Intercept + 产地 
within Subjects Design: factor1 


图 14-24 多 变量 检验 结果 


(2) 重合 轮廓 检验 : 结果 见 图 14-25， 选 择 “Tests of Between-Subjects effects” 中 的 
“Group”， 了 =24.938，P=0.000<0.01， 可 见 两 总 体 的 轮廓 没有 重合 ， 结 合 图 14-26 可 知 ， 
产地 2 的 均值 要 高 于 产地 1。 


Estimated Marginal Means of MEASURE 1 


= .6000 
= 
= 一 1 
:= 
:号 .4000 
| 
3 
;5 
Tests of Between-Subjects Effects 号 2000 
MeasureMEASLURE 1 8 
Transformed Yariable.AMverage Te 
Type lll Sum 二 
Source of SqUAres df Mean Square F Siy. 
Intercept 2.746 1 之 ,了 十 后 71.968 0.000 0000 
产地 0 .951 1 0 .951 24.939 D0.000 
Errar D0 B87 18 0.038 


factorl 


图 14-26 ”两 产地 轮廓 图 
(3) 水 平 轮 廓 检验 : 如 果 两 组 轮廓 不 仅 平 行 而 且 重 合 ， 可 将 两 组 资料 合并 成 一 组 ， 


图 14-25 ” 主 效 应 结果 
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检验 合并 后 的 轮廓 是 否 水 平 。SPSS 操作 步骤 与 上 述 相同 ， 只 不 过 不 考虑 分 组 因素 ， 所 以 
不 需要 将 产地 选 入 “Between-Subjects (factors) ” 框 中 。 结 果 见 图 14-27 中 的 factorl， 
f=10.284，P-=0.000<0.01， 显 示 5 项 指标 均 数 不 同 ， 即 不 平行 。 


Multivariate Testsb 
‘Effect Vaue 上 Hypothesisd Erord 59 
factorl Pilai'sTrace 0720 102843 4000 16000 0.000 
vilks' Lambda 0280 10.2843 4.000 16.000 0.000 
Hotelling's Trace 2.571 10.2843 4.000 16.000 0.000 
Rovy's Largest Root 2.571 10.284a 4.000 16.000 0.000 


a. Exact statistic 
6 Design: Intercept 
vithin Subjects Design: factori 


图 14-27 不 分 组 多 变量 检验 结果 

知识 总 结 

在 我 们 处 理 数据 时 ， 经 常 遇 到 一 个 观察 单位 的 观测 指标 〈 因 变量 ) 常 有 多 个 ， 并 且 
enn 互相 影响 。 对 于 这 种 资料 ， 如 果 将 各 个 反应 变量 割裂 开 分 别 
进行 统计 分 析 ， 这 时 会 导致 检验 效率 低 、 增 大 工 类 错误 及 忽视 变量 间 的 相互 关系 。 因 此 ， 
应 该 进行 多 变量 分 析 。 

多 变量 分 析 资 料 应 该 满足 各 因 变 量 服从 多 元 正 态 分 布 ， 各 观察 对 象 之 间 相 互 独立 、 
各 组 观察 对 象 反 应 变量 的 方差 协 方 差 矩 阵 相 等 ， 以 及 反应 变量 间 在 专业 上 的 确 存 在 一 定 
的 关系 。 

轮廓 分 析 是 比较 两 组 或 多 组 多 变量 均 数 回 量 的 轮廓 是 否 相等 ， 分 析 方 法 上 从 属于 多 
变量 分 析 。 本 章 采 用 了 Analyze 一 General Linear Model 一 Multivariate 和 Analyze 一 General 
Linear Model 一 Repeated Measures 两 个 模块 实现 多 变量 分 析 与 轮廓 检验 。 


学 习 了 初级 说 一 说 ， 中 级 比 一 比 ， 终 于 来 到 高 级 找 关 系 ， 即 统计 模型 。 本 篇 章 将 介 
绍 线性 相关 、 线 性 回归 、Logistic 回归 、 生 存 分 析 、 聚 类 分 析 、 判 别 分 析 、 主 成 分 与 因子 
分 析 ， 掌 握 这 些 统计 分 析 ， 你 基本 就 可 以 在 学 术 的 江湖 里 游 个 泳 啦 ! 


松 哥 统计 


&Y 


2 分 
1> 

1 > 
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>“ 第 15 章 关联 与 相关 分 析 


前 和 面 章 节 讲 述 的 是 差异 性 分 析 ， 主 要 研究 的 是 组 间 差 异性 比较 ， 非 要 分 出 一 个 谁 高 
谁 低 , 谁 好 谁 坏 。 可 是 数据 之 间 的 关系 和 我 们 人 与 人 之 间 的 关系 一 样 ， 除 了 有 竞争 关系 ， 
敌我 关系 ， 还 有 朋友 关系 、 亲 情 关 系 ， 而 且 ， 这 种 关系 还 分 远近 。 数 据 之 间 也 有 关系 ， 
天 系 也 有 下 密 ， 本 章 就 之 着 大 家 一 起 学 习 分 析 数 据 之 间 的 关系 性 强 弱 的 方法 。 


> 15.1 相关 与 天 联 简介 


15.1.1 基本 概念 


相关 分 析 的 一 个 显著 特点 为 变量 不 分 主 次 ， 处 于 同等 地 位 。 研 究 过 程 中 的 一 些 基 本 
概念 如 下 所 述 。 

1. 关联 (association) 

是 指 变 量 间 一 种 广义 的 关联 ， 是 两 个 随机 变量 之 间 统 计 上 的 依赖 关系 。 

2. 相关 《correlation) 

反映 两 个 随机 变量 关系 强度 的 指标 ， 一 般 提 到 的 相关 均 是 指 变 量 之 间 的 线性 相关 。 
相关 与 关联 的 区 别 : 关联 是 指 两 个 变量 之 间 的 一 般 的 关系 ， 相 关 或 多 或 少 是 指 变 量 之 间 
的 线性 关系 。 关 联 是 一 种 概念 范畴 ， 而 相关 是 关联 的 一 种 测量 尺度 。 简 单 地 说 ， 关 联 范 
畴 大 于 相关 。 

3. 线性 相关 

最 简单 的 一 种 关联 ， 两 个 随机 变量 XX、 了 之 间 呈 线性 趋势 的 关系 ， 即 两 变量 共同 增 大 ， 
或 者 一 增 一 减 ， 都 属于 线性 相关 讨论 的 范围 。 

4. 曲线 相关 

两 变量 之 间 存 在 相关 趋势 , 但 并 非 呈 线性 ， 而 是 曲线 。 此 时 不 可 进行 线性 相关 分 析 。 

5. 非 线性 相关 

和 了 之 间 没 有 明显 的 线性 关系 , 却 存在 着 某 种 非 线性 关系 , 说 明 工 仍 是 影响 了 的 因素 。 

6. 秩 相关 

也 称 等 级 相关 ， 对 原 变 量 的 分 布 不 作 要 求 ， 属 于 非 参 数 统计 方法 。 适 用 于 那些 不 服 


从 正 态 分 布 的 资料 ， 还 有 总 体 分 布 未 知 和 原始 数据 用 等 级 表示 的 资料 。 
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7. 正 相 关 与 负 相 关 

两 变量 系 了 同时 增 大 或 减 小 ， 变 化 趋势 是 同 向 的 ， 称 为 正 相 关 ， 两 变量 一 增 一 减 ， 
变化 趋势 是 反 向 的 ， 称 为 负 相 关 。 

8. 完全 相关 

两 变量 之 间 线 性 相关 的 密切 程度 最 高 ， 相 关系 数 的 绝对 值 为 1， 分 为 完全 正 相 关 和 
完全 负 相 关 。 


15.1.2 ”天 联 与 相关 的 类 型 


1. 两 个 计量 资料 之 间 的 相关 
(1) Pearson 相关 : 必须 双 变 量 符合 正 态 分 布 。 
(2) Spearman 相关 : 双 变 量 不 符合 正 态 分 布 或 者 一 个 不 符合 正 态 分 布 ， 或 者 分 布 
不 清 计量 资料 。 对 于 服从 Pearson 相关 系数 的 数据 也 可 以 计算 Spearman 相关 系数 ， 但 统 
计 效 能 比 Pearson 相关 系数 要 低 一 些 〈 不 容易 检测 出 两 者 事实 上 存在 的 相关 关系 ) 。 
2. 两 个 等 级 资料 之 间 相 关 
(1) Spearman 相关 。 
(2) 关联 : 对 于 行 和 列 都 包含 已 排序 值 的 表 ， 请 选择 伽 马 〈 对 于 2 阶 表 ， 为 零 阶 ; 
对 于 3 阶 到 10 阶 表 ， 为 条 件 ) 、Kendall’s tau-b 和 Kendalls tau-c。 要 根据 行 类 别 预 测 列 
类 别 ， 请 选择 Somers’d。 
1) 件 马 (Gamma) 
两 个 有 序 变 量 之 间 的 对 称 相关 性 测量 ， 它 的 范围 是 -1 一 1。 绝 对 值 接近 1 的 值 表示 
两 个 变量 之 间 存 在 紧密 的 关系 。 接 近 0 的 值 表示 关系 较 弱 或 者 没有 关系 。 对 于 双 问 表 ， 
显示 零 阶 伽 马 。 对 于 三 阶 表 到 n 阶 表 ， 显 示 条 件 伽 马 。 
2) Somers” d 
两 个 有 序 变 量 之 间 相 关 性 测量 ， 它 的 范围 是 -1 一 1。 绝 对 值 接近 1 的 值 表 示 两 个 变 
量 之 间 存 在 紧密 的 关系 ， 值 接近 0 则 表示 两 个 变量 之 间 关 系 很 弱 或 没有 关系 。Somers” d 
是 伽 马 的 不 对 称 扩 展 ， 不 同 之 处 仪 在 于 它 包 含 了 未 约束 到 目 变 量 上 的 成 对 的 数目 。 还 将 
计算 此 统计 的 对 称 版 本 。 
3) Kendall’s tau-b 
将 结 考 虑 在 内 的 有 序 变 量 或 排序 变量 的 非 参数 相关 性 测量 。 系 数 的 符号 指示 关系 的 
方向 ， 绝 对 值 指示 强度 ， 绝 对 值 越 大 表示 关系 强度 越 高 。 可 能 的 取 值 范围 是 -1 一 1， 但 
-1 或 +1 值 只 能 从 正方 表 中 取得 。 
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4) Kendall’s tau-c 

忽略 结 的 有 序 变量 的 非 参 数 相关 性 测量 。 系 数 的 符号 指示 关系 的 方向 ， 绝 对 值 指示 
强度 ， 绝 对 值 越 大 则 表示 关系 强度 越 高 。 可 能 的 取 值 范围 是 -1 一 1,， 但 -1 或 +l 值 只 能 
从 正方 表 中 取得 。 

3. 两 个 分 类 变量 之 间 的 关联 

(1) 列 联系 数 (contingency coefficient) : 等 于 卡 方 /(〈 卡 方 +z) ， 其 值 位 于 0 一 1 
之 则 ， 越 大 说 明 相关 性 越 强 。 

(2) Phi and Cramers V: Phi 等 于 卡 方 /N， 越 大 说 明 相关 性 越 强 ，Cramers V 是 Phi 
的 一 个 调整 ， 绝 对 值 越 大 ， 说 明 相关 性 越 强 。 

(3) Lambda 系数 : 用 于 反映 自 变 量 对 因 变 量 的 预测 效果 ， 即 知道 自 变量 取 值 时 对 
因 变 量 的 预测 有 多 少 改 进 ， 或 者 说 知道 自 变 量 的 取 值 时 期 望 预 测 误差 个 数 减少 的 比例 ， 
Lambda 将 误差 定义 为 列 〈 行 ) 变量 预测 时 的 错误 ， 其 预测 值 是 基于 个 体 所 在 行 〈 列 ) 的 
众 数 。 值 为 1 时 表明 上 自 变 量 就 可 以 完全 确定 因 变 量 取 值 ， 为 0 时 表明 上 自 变量 对 因 变 量 完 
全 无 预测 作用 。 

(4) 不 确定 系数 : 其 值 介 于 0 一 1 之 间 ， 和 lambda 类 似 ， 也 用 于 反映 当知 道 自 
变量 后 ， 因 变量 的 不 确定 性 下 降 了 多 少 〈 比 例 ) ， 只 是 在 误差 的 定义 上 稍 有 差异 。 以 灶 
为 不 确定 性 大 小 的 度量 指标 ， 能 输出 行 变量 为 自 变 量 、 列 变量 为 自 变量 、 对 称 不 确定 系 
数 三 个 结果 ， 后 者 为 前 两 者 的 对 称 平均 指标 。 

4. 分 类 变量 与 数值 变量 关联 

希望 测量 一 个 名 义 变量 和 连续 变量 间 的 相关 程度 时 ， 还 可 以 使 用 一 个 叫 作 Eta 的 指 
标 ， 它 所 对 应 的 问题 以 前 是 用 方差 分 析 来 解决 的 。 实 际 上 ， Eta 的 平方 表示 由 组 间 差 异 
所 解释 的 因 变 量 的 方差 的 比例 ， 即 ss ga /ss 总 ， 为 范围 在 0 一 1 之 间 的 相关 性 测量 ， 其 中 
0 值 表 示 行 变量 和 列 变量 之 间 无 相关 性 ， 接 近 1 的 值 表 示 高 度 相 关 。Eta 适用 于 在 区 间 刻 
度 上 度量 的 因 变量 〈 如 收入 ) 以 及 具有 有 限 类 别 的 自 变 量 〈 如 性 别 ) 。 计 算 两 个 Eta 值 : 
一 个 将 行 变量 视 为 区 间 变 量 ， 另 一 个 将 列 变量 视 为 区 间 变 量 。 

5. 偏 相关 〈 了 Partial correlation ) 

当 我 们 处 理 了 和 了 之 间 的 相关 性 时 ， 由 于 Z 与 和 了 都 有 密切 相关 ， 因 此 ZZ 的 存 
在 会 影响 人 和 了 之 间 真 实 的 相关 性 ， 故 需要 控制 Z 后 ， 研 究 了 和 了 之 间 的 相关 性 。 因 
此 偏 相关 又 叫 作 净 相关 。Z 可 能 为 和 了 的 共同 因素 或 者 中 介 因 素 。 常 见 的 偏 相关 是 指 
Pearson 偏 相 天 ， 当 然 还 有 Spearman 仿 相 关 。 
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6. 部 分 相关 《Part correlation) 

有 时 候 ， 研 究 者 想 知道 当 去 除了 第 三 变量 Z 在 基 和 了 变量 中 的 效应 后 ， 两 个 变量 外 
和 了 之 间 的 相关 ， 在 这 种 情况 下 ， 当 用 工 来 解释 了 时， 我 们 仅 将 QZ 从 工 中 去 除 ， 而 保持 
了 的 “完整 性 ”， 在 从 式 中 去 除了 后 ，“ 完 整 的 ”了 因 变 量 和 目 变 量 亏 残 兰 之 间 的 相关 ， 
称 为 控制 也 后 的 式 和 了 之 间 的 部 分 相关 。 

7. 典型 相关 〈Canonical correlation analysis ) 

前 面 的 相关 都 是 研究 两 个 变量 之 间 的 相关 ， 当 我 们 要 处 理 的 资料 为 两 组 变量 之 间 的 
相关 性 时 ， 吏 不 能 采用 上 面 的 相关 性 分 析 了 ， 如 一 个 班级 学 生 的 身体 健康 资料 〈 吴 高 、 
体重 ) 与 考试 成 绩 (语文 、 数 学 、 外 语 ) 之 间 的 相关 性 ， 此 时 就 是 两 组 资料 之 间 的 相关 性 ， 
应 该 采用 — 典 型 相关 分 析 。 一 般 典 型 相关 是 指 两 组 计量 资料 之 间 的 相关 ， 两 组 分 类 变量 资 
料 之 间 的 典型 相关 叫 作 非 线性 典型 相关 。 

8. 距离 相关 《Distance correlation ) 

距离 相关 用 于 计算 数值 变量 之 间 的 距离 相关 性 ， 通 常 不 单独 分 析 ， 一 般 为 聚 类 分 析 
或 者 因子 分 析 的 中 间 过 程 。 Distances 过 程 就 可 以 用 于 计算 记录 (或 变量 ) 间 的 距离 (或 
相似 程度 ) ， 根 据 变 量 的 不 同类 型 ， 可 以 有 许多 距离 、 相 似 程度 测量 指标 供用 户 选 择 。 
但 由 于 本 模块 只 是 一 个 预 分 析 的 过 程 ， 因 此 距离 分 析 并 不 会 给 出 常用 的 p 值 ， 而 只 给 出 
各 变量 / 记录 之 间 的 距离 大 小 ， 以 供用 户 自 行 判断 相似 性 。 

9. 点 二 列 相关 与 二 列 相 关 《Point-Biserial correlation & Biserial correlation ) 

点 二 列 相 关系 数 就 是 当 一 列 变量 为 连续 变量 时 ， 另 一 列 变 量 是 值 域 为 {0，1} 情况 下 
的 Pearson 积 差 相关 系数 。 因 此 ， 在 SPSS 中 计算 点 二 列 相关 的 方法 就 是 计算 这 二 列 变 量 
的 Pearson 相关 系数 。 需 要 注意 的 是 其 中 的 那 列 二 分 变量 的 取 值 范围 必须 是 {0，1}。 

二 列 相 关系 数 就 是 当 一 列 或 两 列 数据 已 经 被 整理 为 分 组 数据 或 成 为 次 数 分 布 表 时 采 
用 的 手工 计算 Pearson 相关 系数 的 替代 性 方案 。 

例如 学 生成 绩 是 连续 变量 (0 一 100) ， 某 一 道 题 给 分 也 是 连续 的 《0 一 6) ， 现 在 
把 这 题 得 分 超过 3 分 的 算 作 一 类 ， 低 于 3 分 的 算 作 另 一 类 ， 就 得 到 了 二 列 相 关 。 二 列 相 
关 的 系数 就 是 这 道 题 的 区 分 度 。 但 是 ， 如 果 是 一 道 是非 题 ， 给 分 时 有 两 档 ， 就 不 是 二 列 
相关 ， 而 是 点 二 列 相 关 。 一 般 而 言 主观 题 的 区 分 度 比 选择 题 高 ， 如 果 把 二 列 相关 当成 点 
二 列 相 关 ， 就 低估 了 主观 题 的 区 分 度 ; 反之 ， 把 是 非 题 当 作 三 列 相 关 计 算 ， 会 高 估 题 目 
的 区 分 度 。 

很 多 人 认为 ， 相 关 只 不 过 是 研究 回归 的 前 考 ， 相 关 其 实 并 没有 多 大 的 学 问 ， 经 过 上 
面 的 前 述 ， 松 哥 相 信 你 的 认识 会 有 所 改变 。 在 众多 相关 与 关联 的 研究 中 ， 很 多 都 停留 在 
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理论 的 范畴 ， 我 们 也 没有 必要 掌握 其 所 有 ， 下 面 松 哥 将 给 大 家 详细 介绍 科研 实践 中 最 为 
常用 的 一 些 相 关 分 析 。 


> lb 


Pearson 相关 是 用 于 两 个 计量 资料 之 间 的 相关 性 ， 应 用 的 条 件 为 两 组 资料 必须 都 符合 


1$.2.1 Pearson 相 天 


案例 实战 

例 15.1: 东 研 究 者 研究 20 名 男 重 的 吴 高 cm) 、 体 重 〈kg) 和 肺活量 〈L) 的 关系 ， 
试 分 析 号 高 和 体重 之 间 的 相关 性 。 数 据 文 件 : data15.1.sav。 

案例 解读 

本 例 研 究 的 是 身高 和 体重 之 间 相 关 性 ， 喘 高 和 体重 均 为 计量 资料 ， 可 以 计算 Pearson 
相关 ， 但 黄 料 应 廊 满 下 正 态 分 布 或 近似 正 态 分 布 。 同 时 基于 专业 ， 我 们 也 可 以 判断 喘 局 
和 体重 之 间 的 相关 是 有 专业 依据 的 。 


实战 步骤 
1. 正 态 分 布 验证 
打开 例 15.1 数据 库 ， 点 击 分 析 一 描述 一 探索 ， 按 照 如 图 15-1 和 图 15-2 所 示 操 作 ， 


所 击 “ 确 定 ” 运 行 。 正 态 性 检验 结果 见 图 15-3。 


@ 转 执 后 (TD) 震 (W) : | 站 可 对 车"| 
未 转换 (U) 


图 15-1 探索 设置 ”图 15-2 正 态 性 检验 
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正 态 性 检验 
柯 尔 莫 戈 洛 夫 -斯 米 诺 夫 。 政 皮 洛 - 威 尔 克 
E11 | 三 主讲 


0.107 | 0.920 
0200 | 0.932 


* 这 是 真 显 著 性 的 下 限 : 
a. 里 利 氏 显 着 性 修正 


图 15-3” 正 态 性 检验 结果 


结果 显示 , DD 检验 与 W 检验 的 P 值 均 大 于 0.05， 因 此 体重 与 身高 均 符 合 正 态 分 布 ， 
可 以 进行 Pearson 相关 性 分 析 。 

注意 : 如 果 DD 检验 和 W 检验 的 结果 存在 矛盾 ， 按 照 大 D 小 W 原则 进行 选择 ， 即 样 
本 量 大 时 选 D 检验 ， 样 本 量 小 时 选 W 检验 。 生 物 医药 里 面 当 样 本 量 大 于 50 即 为 大 。 另 
正 态 性 也 不 是 严格 的 规定 ,近似 正 态 也 可 以 进行 Pearson 相关 分 析 , 如 何 判 断 近似 正 态 呢 ， 
可 以 看 数据 的 直方 图 、PP 图 、QQ 图 。 

2. 散 点 图 分 析 

点 击 图 形 一 旧 对 话 框 一 散 点 /点 图 ( 见 图 15-4) ,弹出 图 15-5， 选择 “简单 散 点 图 ”， 
按照 如 图 15-6 所 示 操 作 。 续 和 朱 见 图 15-7。 


十 图 表 构建 器 (CY. 
有 图 形 面 板 模板 渤 择 器 (GG).. 


旧 则 话 框 止 ) 条 形 图 (8)... 
三 礁 条 形 图 (3)... 


国 误差 条 形 图 (0). 
国术. 口 金字塔 00.. 
孝 点 图 /点 图 (8)... 
直方 图 山 . 


图 15-4 散 点 图 菜单 图 15-5 散 点 图 类 型 选择 


由 图 15-7 可 见 ， 体 里 有 随 看 里 局 变化 而 变化 的 线性 过 势 。 本 例 中 体 草 随 看 时 局 的 增 
局 而 增 大 ， 因 此 ， 里 局 与 体 午 之 间 和 存在 看 正 线 性 相关 。 然 而 敌 扣 图 只 能 帮 我 们 友 现 是 否 
有 线性 趋势 ， 线 性 趋势 的 强 弱 由 Pearson 相关 系数 进行 判定 。 

散 所 图 十 儿 我 们 定性 地 友 现 变量 之 间 的 线性 趋势 的 ， 图 15-8 展示 了 8 种 可 能 的 情况 ， 
只 有 在 〈1) 一 〈4) 情况 下 ， 方 可 计算 Pearson 相关 系数 ， 其 他 情况 不 适合 计算 。 
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十 案 标 注 1 守 (CY! 


「 面 杠 划 六 优 所 : 
行 0m) 1 


[| 


园 共计 去 县 i 过 实行 ) (M4) 
HL : 


FE 


园 琳 委 条 呈 【 开 至 别 ) I{E) 


模板 
加 | 更 俩 用 的 国 圾 按 定 项 的 求 源 册 ] : 


135.0 140.0 143.0 130.0 133.0 160.0 163.0 


轨 


图 15-6 简单 散 点 图 设置 图 15-7 和 号 高 与 体重 的 散 点 图 


l>r>0 .| =] . . 0>r>-l 几 r=-1] 


(1) 正 相关 (2) 完全 正 相 关 (3) 负 相 关 (4) 完全 负 相 关 
0 r=0 IT 一 0 


(5) 无 相关 (6) 无 相关 《7) 无 相关 (8) 非 线性 相关 
图 15-8 ”各 种 散 点 图 


3. Pearson 相 关 分 析 

再 次 回 到 数据 库 ， 氮 击 分 析 一 相关 一 双 释 量 ， 按 照 图 15-9 所 示 设 置 ， 运 行 纤 采 见 图 
15-10。 

结果 显示 身高 与 体重 的 Pearson 相关 系数 r=0.868，P=0.000<0.05， 说 明 身 高 与 体重 
的 相关 性 是 真实 存在 的 , 而 且 呈 现 显 著 相 关 。 前 面 的 相关 系数 + 用 于 判定 相关 强度 的 大 小 ， 
后 面 的 了 值 用 于 验证 前 面相 关系 数 r 和 存在 的 真实 性 。 如 果 本 例 后 面 的 P>0.05， 则 认为 前 
面 的 r=0.868 是 假 的 ， 并 不 存在 ， 只 有 P<0.05， 前 面 的 + 才 有 意义 。 上 面 讲解 的 是 计算 
Pearson 相关 系数 的 标准 流程 ， 融 练 首 艇 点 图 步 又 也 可 以 忽略 。 


导 南 皮尔 于 相 估 性 
显著 性 【 双 尾 ) 


国 皮尔 进 (全 | 洁 德 泵 下 
| 显著 性 检验 个 案 数 
| 加 双 尾 中 日 单 尾 (L) | 体重 。 皮尔 和 进 相 全 性 


标记 显 落 性 相 估 性 (P) 是 著 性 【 双 尾 ) 
Ee 个 案 和 区 


在 0.01 级 别 ( 双 尾 ) :， 相 估 性 显著 


图 1$-9” 双 变量 相关 设置 图 1$S-10 “Pearson 相关 结果 


4. Pearson 相 关系 数 的 意义 

相关 系数 的 绝对 值 越 大 ， 相 关 性 越 强 : 相关 系数 越 接近 1 或 -1， 相 关上 度 越 强 ， 相 关 
系数 越 接 近 0， 相 关上 度 越 弱 。 通 常情 况 下 通过 以 下 取 值 范围 判断 变量 的 相关 强度 : 相关 
系数 0.8 一 1.0 高 度 相 关 ; 0.6 ~ 0.8 强 相 关 ; 0.4 ~ 0.6 中 等 程度 相关 ; 0.2 ~ 0.4 弱 相 关 ; 
0.0 一 0.2 极 弱 相关 或 无 相关 。 


15.2.2 ” 仿 相 关 分 析 


当 我 们 处 理 卫 和 了 之 间 的 相关 性 时 ， 由 于 2Z 与 人 和 了 都 有 密切 相关 ， 因 此 ，2Z 会 影 
加 看 en 故我 们 要 研究 全 和 了 之 间 的 相关 关系 时 ， 应 该 扣除 Z 的 影响 ， 
“ 偏 相关 ”。 例 如 ， 控 制 年 龄 和 工作 经 验 的 影响 ， 估 计 工 资 收入 与 
oa (排除 第 三 Wa 

我 们 在 上 述 和 案例 基础 上 ， 量 市 呼 量 《2Z) ， 我 们 知道 身高 和 体重 均 和 
肺 呼 量 有 关系 ， 如 果 想 知道 身高 和 体重 之 问 的 偏 相关 系数 ， 可 以 按 如 下 步骤 进行 : 

1. 打开 数据 ， 分 析 一 相关 一 偏 相关 ， 如 图 15-11 所 示 ， 将 身高 和 体重 放 入 变量 框 ; 

放 入 控制 变量 框 ， 如 图 15-12 所 示 ， 色 选 “ 零 阶 相 关 性 ”， 


肺活量 
运行 。 

2. 结果 解读 ， 见 图 15-13。 结 果 表 格 分 为 上 下 两 
三 个 变量 之 间 的 两 两 相关 性 。 
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图 15-11 偏 相 关 性 对 话 框 


相关 性 
体重 
相关 性 1.000 
是 著 性 【 双 尾 ) 
自由 度 0 
相关 性 0.868 
显 着 性 【上 不必 0.000 
自由 度 18 
相关 性 0.766 
显著 性 【 双 尾 ) 0.000 
自由 度 18 
相 和 众人 性 1.000 
显著 性 【 双 尾 ) 
自由 度 0 
相对 性 0.794 
是 署 性 【 双 尾 ) 0.000 
自由 度 17 0 


可 单元 情 拓 人 各 委 阶 【皮尔 透 ) 相关 性 


图 1$-13 ” 偏 相 关 分 析 结 果 


图 15-13 结果 分 为 上 下 两 部 分 ， 上 面部 分 是 没有 控制 “肺活量 ”的 情况 下 ， 三 个 变 
量 间 的 两 两 相关 性 和 矩阵， 我 们 可 以 发 现 喘 高 和 体重 的 相关 性 r=0.868，P=0.000<0.05， 存 
在 高 度 相 关 ， 如 果 不 勺 选 图 15-12 中 的 “ 零 阶 相关 性 ”， 则 不 会 出 现 这 部 分 ， 松 哥 勺 选 
是 想 让 大 家 在 一 张 表 里 进行 对 比 ; 下 半 部 分 为 对 高 与 体重 的 偏 相 关系 数 partial correlation 
/一 0.794, P=0.000<0.05, 意 即 扣除 肺活量 影响 后 , 身高 和 体重 之 间 的 净 相 关 还 是 有 意义 的 ， 
但 比 简单 相关 系数 小 了 一 点 点 。 

3. 偏 相 关 散 点 图 制作 

简单 相关 分 析 ， 直 接 在 作 图 一 散 点 图 中 ， 就 可 以 做 出 两 个 变量 之 间 的 散 点 图 ， 可 是 
偏 相 关 是 扣除 某 个 变量 影响 之 后 的 散 点 图 ， 该 如 何 制作 呢 ? 现在 我 们 就 来 做 身高 与 体重 
偏 相 关系 数 的 散 点 图 。 

(1) 回归 ; 以 身高 为 因 变 量 ， 肺 呼 量 为 自 变 量 ， 操 作 如 图 15-14 和 图 15-15 所 示 。 
本 部 分 的 学 习 可 以 在 学 习 了 后 面 的 回归 之 后 ， 再 回来 学 习 。 
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未 标准 化 (UU) 


标 帮 化 (RR) 
调整 后 亿 ) 
站 平均 值 预 宙 怀 蔗 误 香 已) 


本 sm 项 可 影响 统 
< 马 氏 距 高 tH) D 但 eta 
(se a > Re [过 同 库 克 距 高 (K) 回 标准 1 DriBetal2) 
: i | Gn 加 杠杆 江 r&Y CFit 


回 | 标准 人 DIFit 


汕 测 区 旧 | [| 标 ; 
回 平均 值 山 ) 加 单 值 心 协 方 茬 比率 [WI) 
置信 多 IBWCY : 95 中 


部 数 后 计 
冲 | 建 条 藉 统 计 癌 
颌 创建 新 数据 售 


数据 焦 名 称 (D) : 
迁 择 变量 [E) : 是 写 新 歼 据 文件 


| | | 区 ET 
FE . | 个 华 标 答 (E) ， 
[ | 


一 一 WLS 权重 出 ): 
有 


图 15-14 ”线性 回归 对 话 框 图 15-15 线性 回归 : 保存 设置 


(2) 继续 以 体重 为 因 变量 ， 以 肺 呼 量 为 自 变 量 ， 进 行 回归 ， 操 作 参 照 步 又 (1) 。 

(3) 回 到 数据 视图 ， 发 现 产 生 2 个 新 的 残 差 变量 ，RES1 和 RES2， 如 图 15-16 所 示 。 

(4) 我 们 对 RES1 和 RES2 做 相关 分 析 ， 步 又 请 参照 前 述 。 结 果 见 图 15-17。 

我 们 发 现 ， 两 次 回归 的 残 差 相关 系数 r=0.794，P=0.000<0.05， 结 果 居 然 和 上 首 
相关 系数 是 一 模 一 样 的 。 说 明 侦 相关 系数 是 可 以 用 回归 的 残 甜 相关 系数 进行 计算 缠 
么 它们 之 间 的 散 点 图 ， 也 是 可 以 代表 偏 相关 散 点 图 的 哦 ! 


由 编号 >» 1 相 尖 性 
1 * 46698 一 4, Unstandardized Unstandardized 
2 .46792 9, 34: Residual Residual 
3 0. 93208 一 3. Unstandardized Residual ”皮尔 逊 相 矣 性 1 
4 .83302 1. 显 营 性 ( 双 尾 ) 
5 . 17642 lL 小 案 类 7 
- 1 也 ee Unstandardized Residual 皮尔 进 相 估 性 0.794 1 
8 83008 0. 显 着 性 ( 双 尾 ) 0000 
9 个 康 数 20 20 


| 


* 在 0.01 级 别 〔 双 尾 ) ， 相 估 性 显著 。 


图 15-17 ” 残 差 相关 系数 


操作 : 图 形 一 旧 对 话 框 一 散 点 图 /点 图 ， RES1 放 入 了 ，RES2 放 入 闷 得 到 散 点 
15-18。 注 意 该 图 形 就 是 映 高 与 体 午 的 偏 相 关 艇 点 图 图 形 ， 但 是 数值 对 应 不 上 ， 需 概 
RES1+ 号 高 的 均 数 和 RES2+ 体 午 的 均 数 作 图 ， 束 可 以 还 原 为 标准 的 偏 相 关 散 点 图 了 。 
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10.00000 


3.00000 


0.00000 


RESI1 


-3.00000 


-10.00000 


-13.00000 


-3.00000-2.30000 0.00000 2.30000 3.00000 7.30000 
RES2 


图 15-18 ” 残 差 散 点 图 


(6) 偏 相 关 散 点 图 修饰 。 

利用 描述 功能 ， 可 以 分 别 得 到 身高 均值 =151.08， 体 重 均值 =35.70; 再 利用 计算 功能 
计算 2 个 新 的 变量 ， 身 高 1=RES1+151.08， 体 重 1=RES2+35.70， 继续 做 身高 1 和 体重 1 
的 散 点 图 , 见 图 1S-19。 哇 ! 你 会 发 现 两 图 的 图 形 是 一 样 的 ,但 是 坐标 轴 的 尺度 发 生 了 变化 。 


160.00 
133.00 


证 150.00 
DINN 


145.00 


140.00 


28.00 30.00 32.00 34.00 36.00 38.00 40.00 42.00 
体重 1 
图 15-19 ”修饰 后 残 差 散 点 图 


注 : 图 15-19 是 演示 如 何 制 作 仿 相 关 的 散 挟 图 ， 如 有 果 你 正式 作 图 发 表 ， 还 请 将 坐标 


| 第 15 章 关联 与 相关 分 析 | 243 


轴 做 成 标准 的 形式 ,如 图 15-20 所 示 。 只 要 双击 需要 修改 的 部 分 ,激活 后 修改 就 可 以 了 。 


160.00 


133.00 


140.00 


28.00 30.00 32.00 34.00 36.00 38.00 40.00 42.00 
体重 (kg) 


15-20 ”完善 后 偏 相 关 散 点 图 


=> 15.3” Spearman 相关 及 偏 相 关 


Spearman 相关 用 于 两 种 情况 ， 一 种 情况 是 上 述 Pearson 相关 条 件 不 符合 时 (Pearson 
相关 条 件 为 双 变 量 均 符合 正 态 分 布 ), 即 双 变量 都 不 符合 或 者 其 中 一 个 不 符合 正 态 分 布 时 ， 
要 用 Spearman 相关 ; 另 一 种 情况 为 ， 两 个 变量 至 少 有 一 个 为 等 级 变量 时 。 


1$.3.1 Spearman 相 关 


案例 实战 

某 课题 组 研究 身高 与 体重 之 间 的 相关 性 ， 测 量 20 个 学 生 ， 得 到 和 喘 高 (1= 矮 、2= 中 、 
3= 高 ) 和 体重 (1= 轻 、2= 中 、3= 重 ) 的 数据 ， 见 datal5.2.sav。 试 计算 身高 和 体重 之 间 

案例 解析 

本 例 计算 身高 和 体重 之 间 相 关 性 , 然而 身高 和 体重 的 测量 尺度 均 为 等 级 变量 ， 因 此， 
采用 等 级 Spearman 相关 更 为 合适 。 

1. 操作 : 打开 数据 集 , 点 击 分 析 一 相关 一 双 变 量 , 如 图 15-21 所 示 , 将 身高 和 体重 放 入 变量 
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框 ， 勾 选 “ 斯 皮尔 曼 ” 相 关 。 

2. 结果 解读 

如 图 15-22 所 示 ， 身 高 与 体重 的 等 级 相关 系数 r=0.711，P=0.000<0.05， 说 明 身 高 和 
体 午 之 加 真实 存在 强 相 关 天 系 。 图 15-21 中 的 肯 德 尔 tau-b (k) 系数 是 非 参数 相关 ， 仅 用 
于 双 变 量 均 为 等 级 资料 的 时 候 ， 其 适用 范围 没有 Spearman 相关 广 。 


而 双 变量 相关 性 | 


导 间 体重 
有 | 相 壬 系数。 1 00 
显著 性 〔 双 尾 ) ”i 
显 基 性 检验 个 素数 20 20 
| ea 时 单 民 册 ) ] 体重 和 关系 数 0711 1.000 
局 标记 咀 产 性 相 革 性 (F] 显著 性 【 双 尾 ) 0.000 | 
站 率 业 20 20 
Ss 夸 在 0.01 级 别 (到 尾 ) : 相关 性 显著 。 
图 15-21 双 变 量 相 关 性 对 话 框 图 15-22” ”Spearman 相关 分 析 结 果 


15.3.2 ”Spearman 仿 相关 

前 面 说 Pearson 相关 时 ， 提 到 会 存在 第 三 个 变量 的 影响 ， 为 了 消除 影响 ， 于 是 采用 
了 偏 相 关 ， 等 级 相关 依然 会 受到 第 三 个 变量 的 影响 ， 可 是 在 SPSS 中 的 偏 相 关 只 是 针对 
Pearson 偏 相 天 ， 等 级 相关 不 可 以 做 ， 下面 松 哥 教 你 如 何 编程 实现 。 


案例 实战 
某 研究 者 检测 了 20 名 学 生 的 身高 、 体 重 和 肺 呼 量 ， 欲 研究 身高 和 体重 的 净 相 关系 数 。 
案例 解读 


本 例 身 高 和 体重 为 等 级 资料 ， 应 该 计算 Spearman 相关 ， 但 本 例 已 知 变量 中 ， 肺 活 量 
与 身高 和 体重 均 有 相关 关系 ， 欲 研究 阐 相 关 ， 应 访 扣 除 肺 活 量 对 二 者 的 影响 ， 应 该 采用 
偶 Spearman 相关 。 

1. 分 析 一 相关 一 双 变 量 ， 选 择 Spearman 相关 ;如 图 15-23 所 示 ， 点 击 “ 粘 贴 ”， 程 
厅 视 图 目 动 强 出 ， 并 把 刚才 的 操作 程序 显示 出 来 。 如 图 15-24 所 示 。 

2. 修改 程序 ， 见 图 15-24 中 的 程序 ， 修 改 为 图 15-25 中 的 程序 ， 运 行程 序 即 可 ， 编 
写 程序 如 图 15-25。 
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相 过 凑 数 


皮尔 进 (N) 加 肯 德 尔 tau-b(Kj 司 斯 皮尔 灵 (S) | 


旺 冰 性 术 验 
| 惫 双 尾 让 ) 总 单 尾 作 ) 


标记 时 童 性 相 天 性 候 ) 


站 * 语 去 2 - IBM SPSS Statistics 语法 编辑 器 


REGODOE MSSING = LISTWISE 
| FRRTAUCORRA 3 Ohare OUT. 
RECODE rowtype_(RHO=CORR’) . 
PARTIAL CORR Y X BY Z 


NONPAR CORR 


国 轩 2 加 肝 及 站 | |: 
a 一 了 
一 NONPAR CORR NONPAR COARR YY XZ 
外 


llE wssInG = USTWISE 
| 两 呆 |waTRK IN 


lIBM Spas Statistics ee i ONlInscol20 | | 


所 示 结 


1. 由 图 15-26 可 见 ， 肺 活 量 与 身高 (r=0.8$4， 产 0.000) 和 体重 (xr0.453， 记 =0.045) 


均 有 相关 性 ， 同 时 身高 和 体重 的 r=0.711，p=0.000。 


2. 图 15-27 为 控制 肺活量 之 后 的 号 高 与 体 时 之 间 有 的 r=0.699，P=0.001<0.05。 
相 估 考 ” 相 尖 人 性 
人 于 向 及 浊 控制 琶 人生 身高 
斯 诺尔 受 Rho ”体重 相关 系数 1.000 0.711 0.854 肺 活 最 ”体重 ” 相 估 性 


显效 性 ( 双 尾 】) ee 0.000 0.000 显著 性 ( 双 尾 ) | 
自由 度 0 _17 
相 估 性 0699- 
显著 性 ( 双 尾 ) 
自由 度 


ee ( ( 双 必 


用 会 系数 .日 54 
显 者 性 ( 双 尾 ) , .04 


a. 成 列 个 案 数 =20 


图 15-26” Spearman 相关 矩阵 图 15-27 ” Spearman 偶 相 天 
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知识 拓展 

1. 有 人 会 说 , 上面 控 制 与 未 控制 相关 系数 相差 很 小 ,不 控制 也 可 以 吧 ? 本 例 相 差 很 小 ， 
那 是 基于 本 例 的 数据 ， 有 时 候 没 有 控制 的 时 候 P<0.05， 当 控制 之 后 ， 就 发 现 P>0.05 了 ， 
直接 出 现 颠 履 性 的 结论 。 

2. 上 面 的 偏 相关 不 仅 是 只 能 控制 一 个 变量 ， 也 可 以 同时 控制 有 影响 的 多 个 变量 ， 在 
Pearson 偏 相 关 时 ， 只 需 将 多 个 变量 放 入 控制 变量 ，Spearman 偏 相 关 ， 需 要 在 BY 语句 后 
添加 多 个 变量 。 

3. 上 面 的 相关 ， 不 管控 制 与 未 控制 ， 实 质 上 计算 的 都 是 2 个 变量 之 间 的 相关 性 。 如 
果 计 算 1 个 变量 与 1 组 变量 ( 2 个 ) 的 相关 性 ， 如 研究 肺 呼 量 (了 7) 与 身高 (x) 、 体 
重 〈x>) 的 相关 性 ， 则 可 以 利用 回归 ， 得 到 复 相关 系数 R， 复 相关 系数 RR 就 反映 1 个 变 
量 与 1 组 变量 的 相关 性 。 

4. 如 果 想 知道 多 个 变量 之 间 总 的 相关 性 ， 如 想 知 道 身 高 、 体 重 与 年 龄 三 者 之 间 总 的 
相关 性 ， 那 应 该 怎么 办 呢 ， 我 们 可 以 计算 非 参 数 -个 相关 样本 里 面 的 肯 德 尔 和 谐 系 数 。 

5. 如 果 要 计算 一 组 变量 与 另外 一 组 变量 之 间 的 相关 性 , 我 们 可 以 计算 典型 相关 分 析 。 


也 15.4 ”上 典型 相关 


典型 相关 是 计算 一 组 变量 与 男 一 组 变量 之 间 相 关 性 分 析 的 方法 。 典 型 相关 的 思想 有 
扩 类 似 于 主 成 分 分 析 ， 如 果 本 节 看 不 懂 ， 可 以 到 主 成 分 章节 学 习 后 ， 再 回来 学 习 。 松 昌 
简单 描述 一 下 思想 ， 和 希望 你 能 够 理解 ， 如 图 15-28 所 示 ， 典 型 相关 就 是 将 两 组 变量 ， 每 
组 各 目 虚 构 出 1 个 综合 变量 4 和 综合 变量 B,， 然 后 研究 综合 变量 4 和 B, 之 间 的 相关 性 。 
但 是 多 数 的 时 候 虚构 出 的 变量 不 能 代表 本 组 所 有 变量 的 信息 或 者 特征 ， 于 是 再 进一步 虚 
构 出 4, 和 B,、4; 和 B, 等 ， 当 每 组 的 信息 能 够 被 虚构 出 的 几 个 变量 解释 绝 大 部 分 时 ， 则 
结束 ， 不 再 虚构 。 


15-28 ”典型 相关 思想 示意 图 
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案例 实战 

为 了 研究 气象 因 系 与 传染 病 发 病 之 间 的 相关 性 ， 获 得 菏 省 近年 的 月 平均 气压 (VY) 、 
月 平均 气温 (了) 、 月 平均 降水 量 ( 国 ) 、 月 平均 风速 〈 马 ) 与 阔 痢 发 病 率 (了 了，〉、 流 感 
友 病 鞭 《〈 丈 ) 和 流 脑 友 病 于 (五 )， 数 据 请 见 datal5.3.sav， 试 分 析 气 象 与 疾病 友 病 之 间 
的 相关 性 。 

案例 解析 

本 例 研 究 2 组 因 系 之 间 的 相关 性 ,气象 因 系 包括 平均 气压 (XY) 、 月 平均 气 罗 (2 ) 、 
月 平均 降水 量 (X;) 、 月 平均 风速 (和) 共 4 个 变量， 疾病 因素 包括 菌 痢 发 病 率 (7) 、 
洲 感 发 病 率 〈 卫 ) 和 诉 脑 有 病 率 〈 鳌 ) 共 3 个 因 妹 ,现在 想 知道 这 2 组 因 系 之 间 的 相关 性 ， 
因此 ， 应 该 采用 典型 相关 。 

1. 打开 数据 集 datal5.3.sav， 玉 早点 击 : 分 析 一 相关 一 典型 相关 ， 如 图 15-29 所 示 。 
注意 SPSS 中 功能 模块 前 面 有 “二 ”表示 的 ， 为 非 SPSS 回 有 功能 ， 定 通过 安 闻 过 程 中 加 载 
Python 程序 添加 的 功能 ,， 如 采 你 的 SPSS 疫 有 ,， 表示 你 安装 时 在 加 载 Python 时 选择 了 “人 否 ”。 

2. 典型 相关 设置 , 如 图 15-30 所 示 。 将 气象 因子 因 系 放 入 集合 1, 疾病 因 系 放 入 集合 2。 


分 析 (A) 直销 M) ”图 形 {G) ”实用 程序 (U) 扩展 的 蛤 典型 相关 性 
有 报告 人 P) 一 一 一 一 - 
措 沁 统计 仿 ) 入 月 平均 气压 Bl 
表 介 ) 六 月 平均 气温 pa 
. 克 月 平均 降水 县 [x3] 
二 BRR 
一 般 线性 模型 (G) 
广 灾 线性 模型 世 } 
温和 全 模型 


| 


对 数 线 性 [ 口 ) 
神经 网 络 [0N) 
分 类 [F) 
降 准 皮 ) 


图 15-29 上 典型 相关 玉音 15-30 ”典型 相关 设置 


结果 解读 
图 15-31 为 典型 相关 系数 及 其 检验 结果 , 发 现 提取 3 个 典型 相关 系数 分 别 为 0.803、0.330 
和 0.141， 但 是 后 面 检 验 ， 只 有 第 一 相关 系数 是 有 意义 的 ， 王 7.230，P-0.000<0.05。 


时 型 相持 隆 
相关 性 特征 值 。 威 尔 克 统计 F 分 于 自由 度 ” 分母 自由 度 ” 显 者 性 
.250 12.000 156.391 | WOU | 


国 瑞 型 相关 性 


和 下 于 下 林 


2 0.330 0D.122 Dar 1 .402 6b.000 120.000 .29 
习 口 .1 二 1 D0.020 0.980 、 . 
HD for Wilks 检验 是 指 当前 行 和 后 凌 行 中 的 相 从 性 均 为 雷 


图 15-31 典型 相关 检验 结果 
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图 15-32 (A) 为 4 个 气象 因素 与 提取 出 的 3 个 典型 变量 的 非 标准 化 相关 系数 矩阵 ; 
图 15-32 (B) 为 3 个 疾病 因素 与 3 个 典型 变量 的 非 标准 化 相关 系数 矩阵 。 如 果 研 究 变 量 
单位 相同 ， 则 看 非 标 准 化 相关 系数 ， 研 究 变 量 单位 不 同 ， 则 看 标准 化 相关 系数 。 本 例 研 
究 单 位 不 同 ， 因 此 看 标准 化 相关 系数 。 

15-33 (A) 为 4 个 气象 因素 与 提取 出 的 3 个 典型 变量 的 标准 化 相关 系数 和 矩阵; 
15-33 (B) 为 3 个 疾病 因素 与 3 个 典型 变量 的 标准 化 相关 系数 和 矩阵。 可 以 得 出 集合 1 第 
一 典型 变量 成 =-0.183xxi+0.989xxz+0.058xxs+0.721xx， 其 中 心 和 xz 的 系数 绝对 值 较 大 ， 
反映 气象 因素 第 一 典型 变量 主要 由 x,( 月 平均 气温 〉 和 xz (月 平均 风速 ) 构成 ; 集合 2 
第 一 典型 变量 到 =-0.809xyi+0.419xy+0.383xy;， 其 中 y,〈 菌 痢 ) 的 系数 绝对 值 较 大 ， 因 
此 集合 2 的 第 一 典型 变量 主要 由 y,〈 菌 痢 ) 构成 。 


A 集合 1 非 标 准 化 典型 相关 柬 煞 集合 1 标准 化 丰 型 相关 系数 


变量 1 2 3 变量 1 2 3 

x 0.021 -0248 0218 x -0183 -2125 1.874 
x2 -0.104 -0.109 0.230 X2 -0.989 -1.029 2.183 
lL 和 D0.001 -0.013 -0.015 x 0.058 -0.881 -1.003 
Xd 1.332 0.006 -0.225 Xd4 0.721 0.003 -0.122 


© 集合 2 标准 化 典型 相 估 系数 


Le- 变量 1 2 3 
yi1 -0.004 O004 0001 Yi -0.809 0.722 0.120 
i 0006 -D002 0.013 ya 0.419 -0.134 O947 
Y3 0225 O567 -0.110 Y3 0.383 0 .966 -0 .187 
图 15-32 相关 系数 矩阵 结果 图 15-33 ”典型 相关 系数 


因为 第 一 典型 变量 间 的 相关 性 为 0.803， 为 高 度 相 关 ， 因 此 结合 上 述 分 析 结 果 ， 我 们 
可 以 得 出 月 平均 气温 越 高 ， 越 容易 发 生 菌 独 ; 风速 越 大 ， 越 不 容易 发 生 菌 痢 。 

图 15-34 (A) 和 (B) 分 别 为 典型 变量 与 两 组 变量 的 相关 系数 ; 图 15-35 (A) 为 气 
象 因 素 与 疾病 因素 的 典型 变量 的 相关 系数 ， 图 15-35(B) 为 疾病 因素 与 气象 因素 典型 变 
量 的 相关 系数 。 

图 15-36 所 示 为 见 余 分 析 结 果 ， 其 是 以 原 变量 与 典型 变量 间 相 关 为 基础 。 通 过 计算 
X、 了 变量 组 由 自己 的 典型 变量 解释 与 由 对 方 的 典型 变量 解释 的 方差 百分比 与 累计 百分比 ， 
反映 由 典型 变量 预测 原 变 量 的 程度 。“ 和 集合 * 自身 ”表示 第 一 组 原始 变量 总 方差 中 由 本 
组 变 式 代表 的 比例 ，“ 和 集合 1* 集合 2” 表 示 第 一 组 原始 变量 总 方差 中 由 第 二 组 的 变 式 所 
解释 的 比例 ，“ 和 集合 2* 自身 ”表示 第 二 组 原始 变量 总 方差 中 由 本 组 变 式 代表 的 比例 , “ 集 
合 2* 集合 1” 表 示 第 二 组 原始 变量 总 方差 中 由 第 一 组 的 变 式 所 解释 的 比例 。 
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A 集合 1 典型 载荷 A 集合 1 变 允 载荷 


区 呈 3 二 /上 3 
X1 0.552 -0.589 0.445 X1 0.443 -0.194 0.063 
x2 -0.683 0.431 -0.279 X2 -0.548 0.142 -0.039 
X3 -0.532 -0.217 -0.748 x3 -D0427 -0.072 -0.105 
| 0633 0 459 -0D 210 Wd 0509 0Q.152 -0.029 


集合 2 典型 载荷 集合 2 交叉 载荷 
变量 1 2 3 变量 1 2 3 
y1 -0.814 0.403 0.417 yi -0.654 0.133 0.059 
Y2 0.229 0.096 0.969 ¥2 0.184 0.032 0.136 
y3 0.640 0.747 -0.178 y3 0.514 0.247 -0.025 
图 15-34 典型 相关 系数 图 15-35 交叉 载荷 
已 解 笃 的 方 荐 比例 

”典型 变 最 ” 集合 1* 自 身 ”集合 1* 集 合 2 ”集合 2* 自 身 ”集合 2* 集 合 1 

1 0.364 0.234 0.375 0.242 

2 0.198 0.022 0.243 0.027 

3 0.220 0.004 0.381 0.008 


15-36 ”元 余 分 析 结 果 


> 15.5 拓展 : 相关 的 校正 


我 们 在 进行 方差 分 析 时 ， 当 总 的 方差 分 析 有 意义 时 ， 则 需要 进一步 进行 两 两 比 
较 ， 但 是 为 了 防止 出 现 假 阳 性 ， 我 们 党 需要 Bonferroni 校正 。 但 当 我 们 进行 2 组 指标 
多 重 相 关 性 计算 时 ， 也 需要 进行 相关 校正 。 图 15-37 摘自 一 篇 SCI 论文 ， 分 别 为 4 个 
指标 与 2 个 指标 之 间 进 行 Pearson 相关 系数 分 析 ， 可 是 我 们 发 现 其 检验 水 准 a=0.006， 
为 什么 呢 ? 其 实 是 这 样 的 ，4 个 指标 与 2 个 指标 共 需 相关 比较 8 次 ， 因 此 校正 的 
a' 一 0.05/8=0.00625~0.006。 这 就 是 Bonferroni 校正 的 思想 。 


Table 4 
Pearson correlations of MacCAT-T with BOIS (n= 60). 


BCOIS 一 Self-Certainty BCOIS ~ Self-Reflectiveness 


MacCAT-TC understanding 0.12 0.19 
MacCAT=T appreciation —0.20 0.33 
MacCAT-T reasoning —0.21 0.43" 
MacCAT-TCL expressing choice 一 0.11 0.18 


BCIS: Beck Cognitive Insight Scale; MacCAT-T: MacArthur Competence Assessment 
Tool for Treatment; "Bonferroni's correction for multiple correlations: p<0,006. 


图 15-37 ”SCI 论文 相关 系数 校正 摘抄 
讲 到 此 时 ， 最 为 常用 的 相关 ， 松 哥 已 经 介绍 完毕 。 相 关 是 一 种 共 现 关系 ， 相 关 的 两 
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个 因素 相互 平等 ， 无 因果 关系 ， 如 果 存 在 因果 关系 的 相关 ， 那 就 可 以 做 回归 了 。 因 此 ， 
后 面 将 讲解 回归 。 较 为 常用 的 回归 为 线性 回归 、Logistic 回归 和 COX 回归 ， 将 逐 章 讲解 。 
松 哥 常 说 的 初级 说 一 说 ， 中 级 比 一 比 ， 高 级 找 关 系 ， 回 归 也 就 是 寻找 变量 之 间 的 数量 依 
存 关 系 。 中 级 之 前 的 统计 ， 基 本 部 是 定论 了 ， 可 是 到 找 关 系 ， 往 往 同样 的 数据 ， 让 不 同 
的 人 人 分析， 可 能 建立 不 同 的 模型 。 因 此 找 关 系 的 分 析 ， 最 能 体现 一 个 人 的 统计 功底 。 

找 关 系 的 学 习 , 更 多 的 是 学 习 回归 建 模 的 策略 , 然后 根据 专业 确定 一 个 较 优 的 模型 ， 
目前 没有 金 标 准 ， 没 人 敢 说 怎么 做 就 一 定 正确 。 


线性 回归 


统计 分 析 三 级 ， 初 级 说 一 说 ， 中 级 比 一 比 ， 高 级 找 关 系 。 找 关系 的 核心 就 是 建立 模 
型 ， 构 建 变量 之 间 的 数量 依存 关系 ， 以 便 进 行 预测 或 者 控制 ， 然 而 ， 建 模 是 统计 中 的 战 
斗 机 ， 没 人 敢 传授 你 最 标准 的 建 模 方 法 ， 只 能 你 告诉 建 模 的 策略 。 很 多 人 过 度 依 赖 建 模 
结果 ， 而 忽视 了 目 己 的 专业 ， 那 是 不 对 的 ， 应 该 以 专业 为 主导 ， 辅 以 建 模 ， 才 能 构建 一 
个 专业 上 较 优 的 模型 。 本 章 讲解 回归 关系 中 ， 发 展 最 为 成 熟 ， 应 用 也 最 为 广泛 的 线性 回 
归 , 松 哥 按照 由 浅 到 深 的 原则 先 讲解 简单 线性 回归 ,再 谈 多 重 线 性 回归 。 线性 回归 (inear 
regression) 是 分 析 两 个 变量 间 数 量 依 存 关 系 的 统计 分 析 方 法 。 如 果 某 一 个 变量 随 着 男 一 
个 变量 的 变化 而 变化 ， 并 且 它 们 的 变化 关系 呈 直 线 趋势 ， 就 可 以 用 直线 回归 方程 来 定量 
地 描述 它们 之 间 的 数量 依存 关系 ， 这 就 是 线性 回归 分 析 。 


也 16.1 简单 线性 回归 


16.1.1 ”线性 回归 条 件 


简单 线性 回归 是 指 自 变量 (X) 只 有 一 个 ， 因 变量 (7) 也 只 有 一 个 ， 构 建 的 方程 较 
为 简单 : 了 = a+pbX。 任何 一 种 统计 分 析 方 法 均 有 其 适用 的 条 件 ,简单 线性 回归 也 不 例外 ， 
其 适用 条 件 如 下 所 述 。 

(1) 线性 : 因 变 量 了 与 自 变量 蕊 呈 线 性 〈linear) 关系 。 

通过 绘制 (X,， 了) 散 点 图 ， 观 察 散 点 的 分 布 形态 是 否 有 直线 趋势 ， 以 此 来 判断 线性 
关系 是 否 成 立 。 

(2) 独立 性 ， 每 个 个 体 观 察 值 之 间 相 互 独立 (independent) ， 表 现 为 了 值 相对 独立 ， 
在 模型 中 就 是 看 残 差 是 否 独 并。 

(3) 正 态 性 : 应 变量 了 属于 正 态 随机 变量 (normal distribution) 。 

通过 专业 知识 或 残 差 的 散 点 图 来 判断 这 项 条 件 是 否 满足 ， 如 果 数 据 不 满足 正 态 性 条 
件 ， 首 先 考 虑 对 原始 数据 进行 变量 变换 使 其 正 态 化 。 

(4) 方差 齐 性 : 在 一 定 范 围 内 ， 不 同 的 站 值 所 对 应 的 随机 变量 了 的 方 莽 相等 (equal 
variance) 。 


通常 可 利用 (X，7) 的 散 扣 图 或 残 差 的 散 扣 图 来 判断 等 方差 性 ， 如 果 数 据 不 满足 等 
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方差 条 件 ， 可 采用 变量 变换 使 其 方差 齐 性 化 ， 或 采用 加 权 回 归 的 方法 。 
16.1.2 ”线性 回归 建 模 琳 略 


回归 分 析 需 要 结合 专业 、 数 据 、 模 型 诊断 和 研究 目的 ， 方 可 建立 较 优 的 模型 ， 而 且 
模型 也 有 应 用 的 条 件 ， 你 在 美国 建 的 模型 ， 到 中 国 未 必 就 能 用 ， 因 此 ， 也 就 有 咱们 来 自 
各 行 各 业 的 人 构建 目 己 模 型 的 上 必要。 构建 模 型 的 步骤 如 下 : 

(1 ) 专业 考虑 ; 

(2) 和 若 扣 图 验证 ; 

(3) 建 模 ; 

(4) 模型 验证 ; 

(5) 优化 模型 。 

案例 实战 

某 研究 者 调查 了 某 高 校 590 名 大 学 生 的 体重 与 身高 数据 ， 基 于 专业 ， 身 高 会 影响 一 
个 人 的 体重 ， 试 构建 简单 线性 回归 模型 。 

1. 专业 考 上 不 : 本 例 研 究 身 岗 与 体重 的 天 系 ， 专 业 上 认为 喘 赐 和 是 可 以 影 啊 或 反映 体重 的 。 
小 孩 的 个 子 矮 ， 体 午 就 小 。 本 条 专业 上 能 够 得 到 解释 ， 但 喘 高 也 不 是 体重 的 决定 因素 。 

2. 散 点 图 打开 datal6.1 数据 库 , 图 形 一 旧 对 话 框 一 散 点 图 /点 图 , 如 图 16-1 所 示 设 置 ， 
凡 击 “人 确定” 运行。 缩 果 见 艇 后 图 16-2， 喘 局 与 体重 之 间 人 存在 正 相 天 关系 ,符合 专 业 假 定 。 
做 点 图 可 能 存在 的 情况 见 图 16-3。 


140.0 150.0 160.0 170.0 180.0 190.0 
喘 局 


图 16-1 散 点 图 设置 图 16-2 ”身高 与 体重 散 点 图 
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1>r>0 a ;=1 I ,0Q>7r>-l 


/一 一 | 


(1) 正 相 关 (2) 完全 正 相 关 (3) 负 相 关 (4) 完全 负 相 关 


Ean: r=0 . r=30 


(5) 无 相关 (6) 无 相关 (7) 无 相关 (8) 非 线 性 相关 
图 16-3 ”各 种 可 能 的 散 点 图 


3. 回归 分 析 
(1) 分 析 一 回归 一 线性 ， 如 图 16-4 所 示 , 将 体重 放 入 因 变 


(2) 统计 设置 ; 如 图 16-5 所 示 , 保持 默认 设置 ,同时 多 选 “得 宾 - 沃 森 ”和 “个 案 
断 ”， 此 步骤 的 目的 是 独立 性 检验 和 强 影响 点 诊断 。 


量 ， 身高 放 入 块 (B ) 本 


估算 值 臣 ) 
置信 区 间 (N) 
涩 别 (%) : |95 部 分 相关 性 和 侦 相 天 性 (P) 
共 线 性 论断 (L) 


| 辆 德 牢 - 沃 森 (U) 

力 个 案 论断 (C) 

国 高 群 值 (D) : 标准 荐 
日 所 有 个 案 内 


图 16-5 统计 设置 


(3) 图 设置 : 如 图 16-6 所 示 ， 将 标准 化 残 差 (ZRESID) 放 入 了 轴 框 ， 标 准 化 预测 
残 差 C(ZPRED) 放 入 于 轴 框 ， 同 时 色 选 残 差 直 方 图 和 正 态 概率 图 。 此 步 目 的 是 验证 残 差 
是 否 正 态 ， 反 上 映 了 是 否 独 江 。 

(4) 保存 设置 如 图 16-7 所 示 ，SPSS 中 点 击 保生 设置 
保存 的 选项 很 多 ， 未 标准 化 预测 值 和 单 值 95%CI 较为 常用 。 


($5) 选项: 用 于 设置 纳入 和 排除 标准 ， 严 进 0.05， 宽 出 0.1， 一 般 无 须 改动 。 


， 是 指 结果 保存 到 数据 库 9 
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加 未 标准 化 Nl) 
攻 标 蕉 1EA) 
加 党 坐 和 (3) 
国平 均值 预测 标 ; 玲 误 荆 亿 ) 加 删除 后 人 L) 
辐 学 人生 巷 出 队 后 fE) 


距 高 早 响 帝 计 

加 马 氏 距 喜 (HH) 加 D 刘 sta 

同 库 克 距 高 (K) 辐 标准 1E DiBeta 亿 ) 
杠杆 值 司 ) 加 | DIFL 


预测 区 间 一 一 一 | 巴 标准 人 Drrit 
回 平 5 慎 m) 园 单 舍 山 本 | 回 协 方差 比率 ) 
节点 图 1 1 图 信人 区 间 (C) : TE 


赐 线性 回归 : 图 


| | 上 A) | ro 计数 统计 
ll 辐 亨 娃 系数 六 计 人 ) 
[4 -一 一 图 创建 新 数据 集 
一 数据 集 名 称 |D) : 
Ee: 


= 正三 人 新 瞧 据 六 件 


[zereEp | 
[一 [ 玄 件 t)-| 


捅 模型 信息 导出 到 XML 记性 


包括 协 方差 征 阵 凶 | 


图 16-6 图 设置 图 16-7 保存 设置 


(6) 方法 : 因为 只 有 一 个 目 变 量 ， 本 例 选 择 输入 法 。 

输入 法 : 强制 进入 的 意思 ， 不 管 你 有 没有 意义 ， 必 须 进 入 模型 ， 

步 进 法 : 自 变 量 一 边 进入 ， 一 边 检 验 ， 不 符合 再 排除 。 

除去 法 : 此 法 一 般 结合 “ 块 ” 一 起 使 用 ， 将 不 想 纳入 模型 的 变量 放 入 某 个 单独 的 “ 块 ”， 
后 续 分 析 软 件 会 给 出 删除 与 未 删除 该 变量 的 两 个 模型 ， 方 便 作者 比较 。 此 法 较 少 用 。 

后 退 法 : 所 有 自 变量 全 部 先进 入 模型 ， 然 后 把 无 意义 的 删除 ; 

前 进 法 : 先 选择 最 重要 的 自 变 量 进 入 ， 再 从 剩 下 目 变 量 中 筛 选 次 重要 的 进入 ， 如 此 
反复 。 

一 般 而 言 ， 若 多 个 自 变 量 不 存在 简单 线性 相关 关系 ， 步 进 法 、 前 进 法 与 后 退 法 结果 
一 致 ， 当 有 一 定 的 简单 线性 相关 性 时 ， 前 进 法 侧重 筛选 对 立 较 重 要 的 变量 ， 后 退 法 侧重 
引入 模型 联合 作用 较 强 的 变量 ， 步 进 法 位 于 两 者 之 间 。 

4. 结果 解读 

(1) 模型 摘要 与 方差 分 析 结 果 ， 图 16-8 (A) 告诉 我 们 采用 的 是 输入 法 ， 自 变 
量 为 身高 ， 图 16-8 (B) 为 模型 摘要 ，R 为 复 相关 系数 ，R=0.558; R 为 决定 系数 ， 用 
于 反映 模型 的 解释 度 ， 或 者 说 预测 的 准确 性 ， 本 例 R=0.312， 意 即 身 高 仪 能 解释 体重 的 
31.2% 的 变异 , 或 者 说 用 身高 去 预测 体重 , 准确 性 只 有 31.2%。R 会 受 自 变 量 个 数 的 影响 ， 
自 变 量 越 多 ，R 越 大 ， 为 校正 自 变 量 个 数 的 影响 ， 一 般 采 用 后 面 的 调整 RR。 德 宾 - 沃 森 
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(D-W) 检验 ，D-W 取 值 0 一 4， 一 般 认为 值 为 18 一 22 时 ， 数 据 间 相 互 独立 ， 符 合 线 
性 回归 独立 性 的 条 件 ， 本 例 D-W=2.103， 可 以 认为 符合 线性 回归 独立 性 的 条 件 。 

图 16-8(C) 为 模型 统计 检验 结果 ， 采 用 的 是 方差 分 析 ，F=127.800，P-0.000<0.05， 
因此 构建 的 回归 模型 是 有 统计 学 意义 的 。 
输入 /除去 的 变量 * 
模型 ”输入 的 变量 ”除去 的 变量 ”方法 
1 寻 间 .输入 


a. 因 变 量 : 体重 
b. 已 输 人 所 请 求 的 所 有 变量 - 


模型 摘要 
标准 估算 的 误 
展 型 R R 方 调整 后 R 方 闫 德 误 - 沃 森 
1 0.558° 0.312 0.309 4.9526 2.103 
a. 预测 变量 ; (常量 ), 身高 
b. 因 变 量 : 体重 
ANOVA 
模型 平方 和 自由 度 均 方 ER 显著 性 
| 
1 回 娄 3134.691 1 3134.691 127.800 0.000 
残 莽 5916.918 282 24.528 
总 计 10051.608 283 


a. 因 变 量 ; 体重 
b. 预测 变量 : (常量 ), 身高 


图 16-8 ”模型 结果 
(2) 模型 系数 与 个 案 诊断 : 图 16-9 (A) 为 构建 的 模型 的 系数 ， 可 得 出 模型 . 
了 = 二 -50.7+0.614x 身高 

线性 回归 方程 的 回归 系数 意思 为 ,对 每 改变 一 个 单位 ， 了 的 平均 改变 量 也 随 之 改变 ， 
本 例 身 高 每 升 高 lcm， 则 体重 增加 0.614kg。 个 案 诊 断 见 图 16-9 (BE) ， 发 现 1 个 异常 点 ， 
个 案 号 为 195 号 , 其 标准 化 残 差 绝 对 值 超 过 3 个 标准 差 。 建 议 对 上 述 195 号 个 案 进 行 核查 ， 
看 数据 是 否 有 误 。 有 误 更 改 ， 无 误 可 以 考虑 删除 。 

(3) 本 例 将 异常 点 删除 后 ， 再 次 分 析 ， 结 果 如 图 16-10， 结 果 解 释 同 上 ， 此 处 不 再 
重复 解释 。 

(4) 标准 化 残 差 直方 图 ， 图 16-11 为 残 差 直方 图 ， 图 16-12 为 残 差 P-P 图 ， 可 见 总 
体 上 残 差 符合 正 态 分 布 。 说 明 符 合 线性 回归 的 正 态 性 的 条 件 。 
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击 


未 标准 化 系数 标准 化 系数 
异型 B 标准 误 羞 Beta t 显 普 性 
1 ( 涡 量 ) -50.700 8.983 -5.644 0.000 
身高 D.641 DOSr D0.558 11.305 0.000 
a. 因 变 量 : 体重 
个 案 诊 断 ” 
个 案 号 ”标准 残 差 体重 拟 测 慎 线 兰 


195 .418 64.0 46.071 16.9289 


a. 因 变 量 : 仁和 车 


图 16-9 ”模型 系数 与 个 案 诊 断 


直方 图 
因 变 量 : 体重 
标准 差 =0.998 
个 案 数 =283 


3 32300 
回归 标准 化 残 码 


16-11 残 差 直方 图 


模型 摘要 。 
标准 估算 的 误 
横 型 R 尺 方 。 ”调整 后 尺 方 本 往 定 - 沃 琳 
1 癌 与 7 与 0D.331 0.328 十 . 品 5 哲 二 2.096 


a. 预测 变量 (常量 ), 身高 
b. 因 变 量 ; 体重 


ANOVAs 
| 平方 和 ”自由 度 ” ” 光 方 F 好 车 性 
3274935 1 3274935 138.860 0000P 
歼 姜 。 6627.247 281 23.585 
总 计 9902.182 282 
a. 因 变 量 : 体重 


b. 预 调 变 量 : (常量 ), 身高 


系数 


未 标准 化 床上 标准 化 夭 痊 
模型 B 标准 误差 Beta t 显著 性 
1 【常量 ) -53.379 8.842 -6B.037 0.000 
身高 0.6B57 0.056 D0.575 11.784 0.000 
9. 因 变 量 : 体重 
图 16-10 删除 异常 值 后 结果 
回归 标准 化 残 差 的 正 态 P-P 图 
z 因 变 量 ， 体 重 
1.0 
0.8 
密 0.6 
-让 
NR 
FR 0.4 
着 
0.2 
0.0 


00 02 04 06 0.8 1.0 
实测 累计 概率 
图 16-12 残 差 P-P 图 


(5) 等 方差 性 验证 ， 图 16-13 为 回归 标准 化 残 差 与 标准 化 预测 值 散 点 图 ， 数 据点 基 
本 全 部 在 土 3 个 标准 差 之 内 ， 说 明 总 体 效 果 较 好 ， 无 异常 点 ， 但 数据 点 并 没有 在 0 上 下 
对 称 分 布 〈0 参考 线 为 后 续 编辑 加 上 的 ) ， 自 左 向 右 有 放大 趋势 。 说 明 等 方差 性 可 能 不 
大 满足， 但 当 线 性 模型 不 是 用 于 预测 时 ， 等 方差 性 和 正 态 性 不 是 非常 严格 。 本 例 呈现 喇 
以 状 或 者 漏斗 状 ， 也 暗示 模型 中 有 一 些 重要 的 影响 变量 没有 引入 。 从 解释 的 R 角度 ， 也 
可 以 看 出 ， 模 型 仅 可 以 解释 了 变异 的 31.2% 左右 。 
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因 变 量 ， 体重 


回归 标准 化 残 关 


一 3 -2 -1 0 | 3 
回归 标准 化 预测 值 
图 16-13 散 点 图 


=> 16.2 ”多重 线 性 回归 


现实 数据 中 ， 某 件 事 


情 了 仪 仅 由 一 个 下 决定 的 情况 不 多 ， 往 往 都 是 由 多 个 了 决定。 
如 上 一 节 ， 身 高 也 仅 能 解释 体重 的 31.0% 左右 的 变异 。 当 多 个 自 变 量 了 进行 预测 了 时 ， 
所 建立 的 线性 回归 ， 就 叫 作 多 重 线性 回归 。 


案例 实战 
依旧 以 16.1 数据 为 例 ， 尝 试 构建 身高 、 体 重 、 胸 围 对 肺 呼 量 的 预测 模型 。 
实战 步 又 


1. 专业 支持 : 从 专业 角度 ， 身 高 、 体 重 和 胸围 是 可 以 影响 肺 呼 量 的 ， 专 业 上 成 立 ; 

2. 做 散 点 图 和 矩阵: 分 析 一 图 形 一 散 点 图 / 点 图 ， 选 择 和 矩阵 散 点 图 ， 将 4 个 变量 放 入 
5 量 框 ， 点 击 “ 确 定 ”， 得 到 图 16-14 所 示 和 矩阵 散 点 图 结果 。 由 图 可 知 肺 呼 量 与 3 个 自 
变量 一 一 身高 、 体 重 和 胸围 均 有 线性 关系 。 同 时 也 发 现 3 个 自 变 量 之 间 也 存在 相关 性 ， 
可 能 会 影响 分 析 结 果 。 

3. 线性 回归 

(1) 分 析 一 回归 一 线性 ， 如 图 16-15 所 示 ， 将 肺 呼 量 放 入 因 变 量 框 ， 其 他 3 个 自 变 
量 放 入 块 (B) 框 中 。 方 法 选择 : 输入 法 。 
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山 性 别 = 1IFILTER) [fi 


选择 变量 候 ) : J 
Fr 
[S| 个 案 标 签 {C) : 

[> WLS3 权重 恒 ) : 


身高 胸围 肺 呼 量 人 
图 16-14 散 点 图 矩阵 图 16-15 多 重 线性 


(2) 统计 设置 统计 设置 如 图 16-16 所 示 ， 与 简单 线性 回归 相 比 ， 多 了 一 个 共 线 性 
诊断 。 共 线性 诊断 是 对 多 个 目 变 量 之 间 相 关 性 进行 评价 ， 如 果 多 个 目 变 量 之 间 的 相关 性 
较 高 ， 会 导致 模型 出 错 ， 因 此 软件 会 进行 评价 。 

(3) 图 设置 : 同 前 述 简单 线性 。 

(4) 保存 设置 如 图 16-17 所 示 ， 色 选 “ 未 标准 化 ”和 “ 单 值 ”。 色 选 后 软件 会 将 
结果 保存 到 数据 库 视 图 。 


村 [ 戏 关 
| 四 未 标准 化 (My) 
加 标准 标准 化 内 
目 调 问 后 UU 同学 全 {ES3) 
同 有 的 全 汤 册 标准 误差 忆 ) 辐 用 除 后 (L) 
学 在 化 王 队 后 {E) 
影响 统计 
DiBeta 
四 | 标准 化 DfBetatZ) 
DFit 
性 绪 性 回归 : 统计 测 区 让 回 标准 化 DiFil 
| 加 协 占 差 比 襟 岂 
A 


[EE | 民 于 要 
村 言 区 辣 (NI) 司 撕 术 [D) 和 
司 剖 肤 订 数 统计 (O) 


|| (6): 本 
六 司 国 训 吓 钉 娄 后 
协 方 莽 皇 阵 人 wi 二 当 拭 集 韦 和 (OD) : 


转 写 卜 新 数据 交 件 
‖ 名 德 宾 渗 森山 ) [六 件 唱 。 
车 沾 案 治 断 (C) 


| 酝 模 天 信息 导出 到 XML 文件 
辐 训 洗 和 0) 0 | | 
日 所 有 小 案 罗 辐 包括 网 方 郑 拭 阵 四 


图 16-16 统计 设置 图 16-17 保存 设置 
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(5) 结果 解读 : 如 图 16-18 所 示 ， 发 现 异 常 个 案 号 280 号 ， 删 除 后 重新 分 析 ， 继 
续 发 现 96 与 卉 币 ， 将 96 号 继续 删除 后 ， 进 行 分 析 ， 已 经 无 异 单 值 。 后 面 的 结果 为 删除 
280 号 和 96 号 分 析 的 结果 。 因为 本 例 总 样本 量 280 左右 , 删除 1 一 2 个 不 会 影响 总 体 结 果 。 
如 果 你 分 析 时 ， 删 除 1 一 2 次 后 ， 忆 是 有 腊 常 值 的 存在 ， 不 建议 无 限制 删除 下 去 ， 否 则 
数据 失真 ， 即 使 得 到 模型 较 好 的 模型 也 无 法 应 用 。 
个 案 诊 晰 ” 
个 案 号 。 标准 厂 差 肺 呼 量 装 测 慎 疆 差 
280 3.074 4101 2745.77 1355.235 
图 16-18 ”个 案 诊 断 


图 16-19 为 模型 摘要 与 模型 检验 , 图 16-19 (A) 告诉 我 们 采用 输入 法 ,， 自 变量 为 胸围 、 
身高 和 体重 。 图 16-19 (B) 看 模型 解释 度 ，R 只 有 14.8%， 说 明 模 型 解释 度 不 好 。 一 般 
在 描述 性 研究 , 简单 回归 中 , R>0.5 较 好 ，>0.8 就 非常 好 ; 多重 回 归 >0.3 尚 可 ,>0.5 良好 ， 
>0.6 非常 好 ; 但 对 于 实验 性 研究 ，>0.8 以 上 才 有 应 用 的 价值 。 

D-W=1.813， 说 明 数 据 满足 独立 性 ，ANOVA 分 析 ，F=16.074，P=0.000<0.05， 模 型 
有 统计 学 意义 。 本 例 意 即 构建 了 一 个 有 意义 的 统计 模型 ， 但 模型 的 解释 度 不 是 很 好 。 


输 人 /除去 的 变量 = 
懂 型 输入 的 变量 除去 的 变量 方法 


1 胸围 , 身高 , 体重 -和 鞭 人 入 
a. 因 变 量 : 肺 呼 量 
b. 已 输入 所 请 求 的 所 有 变量 。 


已 模型 摘要 
l 标准 估算 的 误 
模型 R 民 方 调整 后 R 方 其 德 误 - 沃 森 
1 0.384° 0.148 0.139 427.557 1.813 
a. 预测 变量 : (常量 ), 胸围 , 身高, 体重 
b. 因 变 量 : 肺 呼 量 
ANOVA- 
模型 平方 和 自由 度 均 方 F 显著 性 
人 
1 回 癸 3815420.481 3 2938473.494 16.074 0.000 
线 荐 50819683.13 218 182804.616 
总 计 59635103.61 281 


a. 因 变 量 : 肺 呼 量 
b. 预测 变量 : (常量 ), 胸围, 身高 , 体重 


图 16-19 ”模型 摘要 与 ANOVA 分 析 
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模型 构建 ;根据 图 16-20 所 示 的 未 标准 化 系数 ， 可 以 写 出 本 例 的 回归 模型 ， 参 照 前 
面 此 处 不 再 歼 述 。 标 准 化 回归 系数 适用 于 比较 身高 、 体 重 和 胸围 3 个 变量 ， 哪 一 个 对 肺 
呼 量 的 影响 最 大 ， 本 例 可 见 体重 标准 化 回归 系数 为 0.28 最 大 ， 说 明 3 个 变量 中 ， 体 重 对 
肺 呼 量 影 啊 最 大 。 

从 表 中 显著 性 结果 来 看 ， 第 数 项 、 身 高 与 体重 尸 值 均 大 于 0.05， 即 回归 系数 无 意义 。 
目前 这 个 地 方 存 在 几 种 看 法 : 〈1) 关于 常数 项 ， 有 人 认为 有 无 意义 ， 没 有 关系 ， 可 以 直 
接 写 入 方程 ， 有 人 认为 既然 无 意义 ， 可 以 在 “选项 ”中 ， 将 常数 项 去 除 ， 即 构建 无 常数 
项 的 方程 。 (2)〉 关于 目 变量 无 意义 的 选项 ， 一 般 均 应 该 从 模型 中 移 除 ， 重 新 建 模 。 但 也 
有 2 种 说 法 ， 当 模型 为 解释 性 模型 的 时 候 ， 重 在 解释 各 和 目 变量 对 了 的 作用 ， 此 时 可 以 留 
在 方程 中 ; 当 方 程 为 预测 性 模型 时 ， 即 构建 的 方程 用 于 预测 时 ， 则 应 该 建立 最 优 预 测 效 
果 的 模型 ， 则 应 该 删除 无 意义 的 目 变 量 。 本 例 中 我 们 尝试 构建 较 佳 的 预测 模型 ， 因 此 ， 
我 们 重新 建 模 ， 方 法 选择 “ 步 进 法 ”， 让 软件 构建 模型 。 得 到 模型 如 图 16-21 所 示 。 


未 标 .入 到 上 | 
标准 识 苦 证 证 


-0.544 0.587] 


0.130 1.896 0.0591 0.647 
0.280 2.655 0.008 0.276 
0.022 0.238 0.812 | 0.363 


图 16-20 ”模型 系数 


图 16-21 为 逐步 回归 的 结果 ， 发 现 3 个 自 变 量 仅 留 取 了 体重 ,常量 与 体重 的 回归 系 
数 均 有 统计 学 意义 。 


素数” 
未 标准 化 系数 标准 化 系 数 共 线 性 统计 
懂 型 日 标准 误 善 Beta l 著 尾 容 盖 VIF 
1 [党 最 ) 1084.964 218.886 4.957 0.000 
体重 28.498 4.281 0.370 6.657 0.000 1.000 1.000 


a. 因 变 最 : 肺 呼 最 
图 16-21 逐步 回归 结果 


共 线 性 诊断 结果 主要 看 容 差 和 VIF (方差 膨胀 因子 ) ， 容 差 取 值 0 一 1， 越 接近 0 共 
线性 越 强 ，VIF 大 于 10 共 线 性 越 强 。 图 16-20 中 可 见 容 差 与 VIF 均 显示 共 线 性 可 以 接受 ， 
图 16-21 因为 只 有 一 个 自 变 量 ， 所 以 容 差 与 VIF 为 1， 无 共 线 性 。 当 出 现 共 线性 较 大 时 ， 
会 导致 回归 系数 符号 异常 或 者 回归 系数 的 大 小 异常 现象 ， 因 此 当 共 线性 比较 大 时 ， 可 以 
采用 如 下 方法 回归 : 
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(1) 逐步 法 回归 ， 但 共 线 性 太 大 时 ， 逐 步 法 也 无 法 全 部 解决 ; 

(2) 岭 回 归 : SPSS 中 无 直接 窗口 操作 ， 通 过 宏 实现 ， 较 少 用 ; 

(3) 主 成 分 回归 : 此 部 分 参见 主 成 分 章 市 。 

知识 小 结 

(1) 线性 回归 应 该 满足 线性 、 独 立 性 、 正 态 性 和 等 方差 性 ， 前 2 个 较为 重要 ， 当 构 
建 模 型 用 于 解释 而 非 预 测 时 ， 正 态 性 和 等 方差 性 不 是 很 严格 。 线 性 可 以 通过 散 点 图 识别 ， 
独立 性 可 以 通过 D-W 检验 识别 ， 正 态 性 通过 残 差 直方 图 与 PP 图 识别 ， 等 方差 性 通过 
ZRESID 和 PRESID 散 点 图 识别 。 

(2) 线 性 回归 分 为 简单 线性 与 多 重 线性 , 多 重 线性 时 , 需要 注意 日 变量 之 间 的 共 线 性 ， 
需要 做 共 线 性 诊断 。 当 存在 较为 严重 共 线 性 时 , 可 以 采用 逐步 回归 、 岭 回归 和 主 成 分 回归 。 

(3) 线性 回归 分 为 解释 性 回归 与 预测 性 回归 ， 解 释 性 回归 用 于 阐明 几 个 自 变 量 对 因 
变量 的 作用 大 小 ， 更 是 从 专业 的 角度 去 理解 模型 ， 一 些 P>0.05 的 变量 依据 专业 可 以 进入 
模型 ， 常 采用 输入 法 。 预 测 性 模型 是 为 了 有 更 好 的 预测 效果 ， 也 就 是 在 统计 学 上 追求 最 
佳 的 模型 ， 此 时 常 采 用 逐步 回归 法 。 

(4) 模型 构建 方法 : 输入 法 是 所 选 自 变量 全 部 进入 模型 ， 逐 步 是 边 进 边 出 ， 回 前 是 
由 少 到 多 ; 向 后 是 由 多 到 少 ; 删除 结合 块 (B) 使 用 ， 软 件 会 计算 删除 与 未 删除 2 个 模 

(5) 样本 量 : 线性 回归 样本 量 大 小 一 般 为 自 变 量 个 数 的 15 ~ 20 倍 ， 样 本 量 过 小 得 
到 的 结果 不 稳定 。 

(6) 线 性 回归 要 求 因 变量 Y 为 连续 性 变量 , 自 变 量 X 可 以 是 连续 性 , 也 可 以 是 二 分 类 、 
等 级 或 无 序 多 分 类 ， 当 是 无 序 多 分 类 时 ， 需 要 设置 哑 变 量 。 当 不 是 连续 资料 时 ， 无 须 散 

(7) 一 个 好 的 模型 ， 不 仅仅 是 统计 学 上 的 最 佳 模型 ， 更 需要 得 到 专业 上 的 可 解释 。 

(8) 当 多 个 自 变 量 所 属 类 别 不 同时 ， 可 以 通过 设置 块 (B) 中 的 “下 一 张 ” 将 不 同 
变量 放 入 不 同 的 块 ， 每 个 块 选择 不 同 的 进入 模型 的 方法 。 这 就 是 所 谓 的 层次 回归 。 当 我 
们 想 知 道 某 个 特别 的 变量 对 构建 模型 有 无 意义 时 ， 可 以 将 其 放 入 单独 的 块 ， 然 后 设置 RR 
改变 量 ， 如 果 R 改变 量 有 统计 学 意义 ， 则 说 明 该 指标 对 于 构建 模型 有 意义 。 

(9) 当 和 存在 异 方 莽 时 ， 可 以 来 用 加 权 最 小 二 乘法 建 并 回归 模型 ， 操 作 方 法 为 先进 行 
线性 回归 ， 将 残 差 保存 为 变量 ， 再 次 回归 将 残 差 作为 权重 。 
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线性 回归 的 因 变 量 了 必须 为 连续 性 资料 (老大 ), 可 是 当 我 们 研究 的 因 变 量 为 等 级 ( 老 
二 ) 或 分 类 〈 老 三 ) 时 ， 因 为 不 再 是 随机 变量 ， 不 符合 正 态 分 布 ， 因 此 不 能 采用 线性 回归 。 
假设 结果 变量 是 二 分 类 ， 发 病 (y =1) 与 不 发 病 (y =0) ， 如 用 率 p 作为 因 变 量 ， 则 其 取 
值 为 0 ~ 1， 不 满足 多 元 线性 回归 中 的 线性 组 合 ( 即 p=atDbjxxjt+…+bsxx 不 成 立 ) ， 因 
为 该 模型 在 不 同 取 值 的 情况 下 , 等 式 左 边 的 P 了 肯定 会 大 于 1, 超出 了 忆 的 0 一 1 的 范围 。 
E 否 通过 某 种 变换 ， 让 等 式 左 边 依然 符合 正 态 分 布 ， 于 是 1970 年 COX 引入 了 人 口 学 领 
域 的 Logit 变换 ， 成 功 解决 了 这 个 问题 。 

logitP=-ln[P/ (1-P) ]， 当 己 取 值 0 一 1 时 ，LosgitpP 取 值 -< 一 +ce， 而 实践 证 明 
LogitP 往 往 与 自 变 量 X 呈 现 线 性 关系 。 于 是 我 们 就 用 LogitP 为 因 变 量 , 构建 线性 回归 模型 ， 
即 Logistic 回归 模型 。 构 建 模型 的 表达 式 为 : logitP = a+ Bixxj+ pp,xxyt+… 十 Pxx,。 当 x 每 
增加 1 个 单位 时 ， 方 程 由 LogitP。 变 为 LogitP。 

loglitP=a+ Bixxt PB,xxst"**t+ Pp xXx, 

logitP.=at Bx (xtl1) +p,xxst"**+ Bo xx 

则 logitP.— logitP.= Bx (x+1) -Pixx= pp 

而 logitPl=ln (Pl-P) , logitPo= ln (Py1- P), 

lomitP— logitP = (P/I—P) = hn (PI—P) 

= (PY Py 7 PI PY | 

印 In[ (CPW/1- PI) / (PYy1- Po) 1=P 

设 P/ (1- P) 是 暴露 组 的 比值 ，PY (1- P,〉 是 非 暴 露 组 的 比值 ， 则 [P/ (1- P) ]7 
[PW (1- Po) ] 被 称 为 比值 比 (odds ratio) OR，lnOR= PB; OR 可 以 作为 相对 危险 度 的 
估计 值 。 大 家 请 注意 ，Logistic 回归 建立 模型 的 目的 重 在 发 现 可 能 的 风险 因素 ， 以 及 比 
较 多 个 因素 对 结局 的 影响 大 小 。 线 性 回归 更 多 的 是 关注 变量 之 间 的 数量 依存 关系 ， 用 
于 预测 与 控制 。 


> 17.1 二 项 Logistic 回归 


二 项 Logistic 回归 的 因 变 量 为 二 分 类 变量 ， 自 变量 可 以 是 任何 形式 的 资料 。 二 项 
Logistic 回归 是 Logistic 回归 的 基础 ， 擎 握 二 项 Logistic 回归 基本 就 可 以 理解 有 序 Logistic 
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回归 、 多 项 Logistic 回归 ， 并 且 二 项 Logistic 回归 应 用 得 非常 广泛 。 

案例 实战 

研究 某 疾 病 的 复发 情况 ， 收 集 该 病 患 者 的 病情 程度 、 治 疗 方法 、 年 龄 和 血型 ， 请 帮 
助 探 讨 该 病 复 发 的 危险 因素 。 (数据 文件 : datal7.1.sav) 。 

案例 解析 

本 例 研 究 的 因 变 量 为 疾病 复发 (0: 未 复发 ，1: 复发 ) ， 影 响 因 素 包 括 病 情 
程度 〈0: 不 严重 ，1: 严重 ) ， 治 疗 方法 (0: 传统 治疗 ，1: 新 疗法 ) ， 年 龄 ( 岁 ) ， 
血型 (1: A 型 ，2: B 型 ，3: O 型 ，4: AB 型 ) 。 注 意 线性 回归 闷 回 归 系 数 的 意义 为 总 
每 改变 1 个 单位 ， 了 的 平均 改变 量 ，Logistic 回归 系数 的 意义 为 全 每 改变 1 个 单位 LogitP 
的 平均 改变 量 ， 是 没有 专业 实际 意义 的 。 在 上 述 变 量 中 ， 血 型 为 无 序 多 分 类 资料 ， 血 型 
的 变量 设置 1、2、3、4 只 是 血型 的 代码 ， 是 平等 的 ， 构 建 模 型 时 不 能 用 1、2、3、4 代入 
模型 ， 应 该 设置 哑 变 量 。 哑 变量 的 个 数 = 类 别 数 -1。 血 型 共 4 个 类 别 ， 因 此 设置 3 个 哑 变 
量 即 可 表示 4 种 血型 。 下 面 就 是 以 A 型 血 为 对 照 构 建 的 三 个 哑 变 量 ，D1、D2 和 D3。 

哑 变 量 的 设置 : 

六 0 地 =0 想 =0 表示 访 弄 。 

D, =1、D, =0、D,0， 表 示 B 型 ; 

D, =0、D, =1、D;=0， 表 示 AB 型 ; 

0 也 = 六 TI， 表示 OG 型。 

3 个 哑 变 量 的 不 同 组 合 对 应 不 同 血型 ,分析 结果 中 , 每 个 指示 变量 均 有 一 个 估计 系数 ， 
Bl、B,、B; 分 别 表示 B 型 血 、AB 型 血 、O 型 血 的 人 分 别 与 A 型 血 的 人 比较 ， 患 白血病 
的 优势 比 的 对 数值 n (OR) 。 相 对 应 的 有 3 个 OR 值 ，OR, 表示 B 型 血 人 患 白血病 的 危 
险 度 是 A 型 血 人 的 OR, 倍 : OR, 表示 AB 型 血 人 患 白血病 的 危险 度 是 A 型 血 人 的 OR, 倍 ; 
OR; 表示 O 型 血 人 患 白 血 病 的 危险 度 是 A 型 血 人 的 OR 倍 。 

分 析 思 路 

先 做 单 因素 分 机， 选取 有 意义 的 自 变 量 再 进行 多 因素 分 机 ， 同 时 为 了 防止 一 些 有 意 
义 自 变量 被 单 因 素 分 析 时 剔除 ， 单 因素 分 析 时 将 检验 水 准 设 为 P<0.1， 只 要 小 于 0.1 即 认 
为 有 意义 ， 然 后 进行 多 因素 分 析 。 

1. 打开 数据 17.1.sav， 先 做 复发 与 疾病 严重 程度 相关 性 分 析 。 分 析 一 回归 一 二 元 
Logistic， 如 图 17-1 所 示 , 将 发 病情 况 (了 ) 放 入 因 变 量 , 疾病 严重 程度 (X) 放 入 自 变量 框 ， 
上 扩 击 “确定 ”运行 。 
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| 杭 Logistic 加 日 


党 ”病情 严重 程度 区 习 


依 血 到 ad] 


”站 择 京 且 但 ) 


i 


图 17-1 二 项 Logistic 回归 设置 


结果 较 多 ， 因 为 单 因 素 分 析 为 变量 筛选 ， 因 此 只 看 主要 结果 ， 见 图 17-2， 发 现 疾病 
严重 程度 Wald 检验 ，P=0.035<0.05， 有 统计 学 意义 。 只 要 小 于 0.1， 即 单 因素 有 意义 ， 
此 处 降低 了 检验 水 准 ， 目 的 是 防止 一 些 有 意义 的 变量 被 错 杀 。 


方程 中 的 变量 
EXP(B) 的 95% 秆 售 区 间 

下 限 上 上限 

1.074 6.678 


B 标准 误 莱 
病情 严重 程度 0.985 0.466 4.468 1 
常量 -0.223 0.335 0.443 1 


a. 在 步骤 1 输入 的 变量 ; 病情 严重 程度 。 


Exp(B) 


步 弛 1 


图 17-2 ”疾病 严重 程度 结果 


2. 继续 逐个 筛选 治疗 方法 (0， 传 统治 疗 ，1: 新 疗法 ) ， 年 龄 ( 岁 ) ， 步 又 与 前 述 一 样 。 
因为 血型 (1: A 型 ，2; B 型 ，3: O 型 ，4: AB 型 ) 为 无 序 分 类 ， 人 情况 不 一 样 ， 在 上 述 
基础 上 增加 一 步 “ 分 类 ”设置 ， 如 图 17-3 和 图 17-4 所 示 。 


国 Lagistic 同日 


具 Logistic 回归 : 定义 分 类 变量 


次 户 情 严重 程度 [让 
着 永 法 bal 


图 17-3 ”血型 单 因素 分 析 图 17-4 ” 哑 变 量 设置 
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3. 疗法 、 年 龄 与 血型 单 因素 分 析 结 果 ， 如 图 17-5 所 示 ， 结 果 可 见 疗法 与 年 龄 己 值 均 
小 于 0.1， 血 型 的 3 个 哑 变 量 中 ， 血 型 (2) 和 血型 (3) 有 意义 。 因 此 ， 本 例 4 个 单 因素 
均 有 意义 , 可 以 进入 多 因素 分 析 模 型 。 注意 ; 在 哑 变 量 中 , 如 果 有 任何 一 个 有 统计 学 意义 ， 
则 所 有 哑 变 量 必 须 都 进入 模型 ， 这 叫 作 哑 变 量 的 同 进 同 出 原则 。 

4. 多 因 系 分 析 :， 分 析 一 回归 一 二 项 Logistic 回归 ， 先 按照 图 17-6 操作 ，“ 分 疾 ” 议 
置 中 马 放 入 哑 变 量 设置 枉 ， 以 最 后 一 个 为 参照 。 如 果 你 想 设置 为 以 第 一 个 为 参照 ， 修 改 
BH 9]。 


方程 中 的 变量 


疗法 1.504 0.487 9.525 
冲 量 -0.405 0.323 1.578 1 0.209 0.667 


a. 在 步 台 1 输入 的 变量 : 疗法 机 Logistic 回归 


步 对 1 


方程 中 的 变量 


年 聆 0.097 0.042 5.349 
党 量 -党 1.324 #4.238 1 


3a. 在 步 蓝 1 输入 的 变量 : 年 龄 ， 


步 椰 1 


0.066 


方程 中 的 变量 


自由 庶 显著 性 
步 台 1” 血型 4.996 3 
血型 (1) D0.241 0.602 0.161 1 1.273 站 
血型 (2) 1.088 0.633 2.959 1 2.970 二 
血型 (3) 1.253 0.709 3.119 1 3.500 Ds 规 W(U) | 
常量 -0.241 0.403 0.358 1 0.766 -- — 一 一 


a. 在 步 要 1 输入 的 变量 ; 血型 


图 17-5 疗法 、 年 龄 与 血型 单 因 素 分 析 结 果 图 17-6 多 因素 Logistic 回归 


保存 设置 ， 如 图 17-7 所 示 ， 义 选 “ 概 率 ” 与 “组 成 员 ”， 此 步 可 以 保存 每 个 个 案 的 
预 训 概率 以 及 预测 及 病 与 未 及 病 扩 朱 。 选 项 议和 赴 ， 勾 选 “EXP〈B) 可 信 区 间 ”， 即 OR 
值 的 95% 可 信 区 间 。 


统计 和 图 
分 类 图 抱 ) 回 沾 算 十 的 相 笑 性 (R) 
加 牌 所 秩 - 蕴 梅 肖 拟 侣 优 诬 b) 回 接 信 历史 志 录 仙 
同 个案 中 莽 列 表 (WW) ET 
葛 外 高 群 倩 史 ) |2 标准 萃 (S) 

加 | 库 克 中 8 高 (C) 加 所 有 个 案 (4) 


ET 


昼 在 每 个 步 标 IE) 总 在 最 后 一 个 步骤 仙 1) 


闻 进 松 率 和 : 
县 大 送信 次 炽 仙 ) : 


站 杠杆 值 (LL) 
DrBeta(s) 


和 模型 信息 导出 到 XML 文件 进入 (0): |0.05 | 降 去 由: 


图 计 对 乒 杂 分 析 或 大 型 数据 非 节省 内 存 皮 ) 
芷 樟 型 中 包括 种 县 芭 ] 


图 17-7 保存 设置 图 17-8 ”选项 设置 


包括 协 方 差 垂 阵 山 
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5. 多 因素 分 析 结 果 : 图 17-9 为 分 类 编码 ， 告 诉 我 们 哑 变 量 如 何 设置 ， 因 为 我 们 设 
置 以 最 后 一 个 为 比较 ， 因 此 选择 O 型 血 为 参照 。 图 17-10 为 模型 检验 与 分 类 表 结 果 ， 图 
17-10 (A) 为 omnibus 检验 ，P<0.05， 说 明 模 型 有 意义 。 图 17-10 (B) 为 模型 的 效果 ，-2 
对 数 似 然 比 检验 越 接近 0， 效 果 越 好 ; 后 面 2 个 为 伪 尺 ， 类 似 于 线性 回归 的 及 ， 越 大 越 好 ， 
最 大 为 1。 图 17-10(C) 分 类 表 ， 反 映 预 测 准 确 性 ， 此 模型 准确 预测 率 为 77.5%。 


模型 了 系数 的 DOmnibus 检验 


上 方 目 由 度 灵 著 性 


步 台 1 步 强 31.064 6 0.000 
二 31.064 6 0.000 
懂 型 41.064 6 0.0U0 


异型 简要 
各 斯 -斯 宁 不 


步 节 -2 对 数 似 然 R 方 内 戈 尔 科 民 方 
1 78.033° 0.322 0.432 
a. 由 于 参数 估算 值 的 变化 不 足 0.001， 因此 估算 在 
第 5 次 选 代 时 终止 ， 
分 炎 变 重油 但 
参数 编码 
顿 率 (1) (2) (3) 发 请 情况 
血型 。” A 型 血 20 1.000 0.000 0.000 ~ 实则 不 人们 有 有 IE 人 比 
步 肌 1 发 病情 况 ”未 发 病 26 8 76.5 
日 型 血 20 0.000 1.000 0.000 i ji 
AB 型 贞 15 0.000 0.000 1.000 PT 和 
0 型 徊 25 0.000 0.000 0.000 3 分 界 值 为 0.500 
图 17-9 分 类 编码 图 17-10 模型 检验 与 分 类 表 结 末 


最 终 模 型 见 图 17-11， 可 见 4 个 变量 均 有 统计 学 意义 ， 方 程 为 : 

LogitP=-6.250+1.352X,+2.453X,+0.118X,+0.940X, 01) +1.9887%, (,) +2.1147X, (3,) 。 
Logistic 回归 方程 意义 不 大 ， 更 重要 的 是 后 面 的 EXP(B) 及 其 95% 可 信 区 间 ， 其 说 明 
了 目 变 量 对 因 变 量 的 发 生 风 险 , 如 OR (病情 程度 ) =3.864,95% 可 信 区 间 1.176 一 12.691， 
意 即 病情 重 的 复发 风险 是 病情 轻 的 3.864 倍 ，95% 可 信 区 间 为 1.176 一 12.691 倍 。 


方程 中 的 变量 
EXP(B) 的 95% 置信 区 间 
日 标准 误差 =< 瓦尔 德 。 ”自由 度 显著 性 ”ExpfB) ”下限 上限 
步骤 1， 。 栅 情 严重 程度 1.352 0.607 4.963 1 0.026 3.864 1.176 12.691 
疗法 2.453 0.683 12.888 1 0.000 11.628 3.046 十 4.381 
年 上 0.118 0.054 4.729 1 0.030 1.125 1.012 1.251 
血型 6.986 3 0.072 
天 型 (1) D.9a0 D0.r21 1.698 1 0.193 2.559 0 .B23 10.518 
血型 (2) 1.988 0.839 5.612 1 0.018 7.300 1.409 37.809 
和 型 (3) 2.114#4 0.997 | 1 0.034 8.282 1.173 8.d99 
常量 -6.259 1.986 9.934 1 0.002 0.002 


a. 在 步骤 1 输入 的 变量 : 病情 严重 程度 , 疗法 , 年 龄 , 血型 


图 17-11 模型 方程 
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6. Logistic 回归 系数 的 意义 : 8 与 优势 比 OR 有 密切 的 关系 ， 同 时 与 暴露 因素 x (如 

服用 上 肉 激 系 〉 的 量化 方法 密切 相关 : 

(1) 当 x 为 二 水 平 ， 设 暴露 时 x=]， 未 骏 圳 时 x=0,， ln (OR) = logitP-logitP,。 

= (atpB*1) — (at+p*0) =p。 

(2) 当 x 为 等 级 变量 ， 按 等 级 顺序 依次 取 为 1、2、…， 一 般 以 最 小 或 最 大 等 级 作 
为 参考 组 ，OR 表示 x 增加 一 个 等 级 时 的 优势 比 。 

(3) 当 x 为 连续 性 变量 (如 年 龄 ) 时 , OR 表示 x 增加 1 个 单位 (如 1 岁 ) 时 的 优势 比 ; 
也 可 将 x 等 级 化 (如 分 成 几 个 年 龄 组 ) 后 再 进行 分 析 。 

(4) 当 x 为 多 分 类 变量 ， 如 研究 血型 与 白血病 发 病 关 系 时 ， 血 型 变量 有 4 个 类 别 ， 
分 别 用 1、2、3、4 表 示 ， 但 因为 各 类 别 之 间 是 独立 的 、 无 等 级 差别 ， 所 以 分 析 时 需 将 x 
转换 为 3 个 哑 变 量 或 指示 变量 (xj、 x%、 X33)。 


字 17.2 有 序 Logistic 回归 


上 一 市 讲解 的 是 因 变 量 为 二 分 类 (0-1) 变量 时 的 Logistic 回归 ， 当 研究 的 因 变 量 为 
等 级 资料 (有 序 资 料 ) 时 ， 如 治疗 结局 为 无 效 、 好 转 、 康 复 三 个 水 平 ， 病 情 为 轻 、 中 、 
重 三 个 等 级 ,此 类 资料 需要 采用 有 序 Logistic 回归 模型 进行 分 析 。 以 3 个 等 级 因 变 量 为 例 ， 
与 传统 的 应 变量 为 二 分 类 的 相 比 ， 进 行 logit 变换 的 分 别 为 区、mHo， 即 应 变量 有 序 取 值 
水 平 的 累积 概率 。 这 种 模型 实际 上 是 依次 将 因 变 量 按 不 同 的 取 值 水 平分 割 成 两 个 等 级 ， 
对 这 两 个 等 级 建立 应 变量 为 二 分 类 的 Logistic 回归 模型 。 

案例 实战 

有 研究 者 研究 性 别 和 两 种 治疗 方法 对 某 病 疗效 的 影响 ， 疗 效 的 等 级 为 3 个 等 级 ， 具 
体 赋值 如 下 : 性 别 : 男 =0， 女 =1; 新 疗法 =1， 旧 疗法 =0; 疗效 : 1= 显效 ，2= 有 效 ， 
3= 无 效 。 试 进行 分 析 。 

案例 解析 

研究 因 变 量 为 等 级 资料 ， 两 个 自 变 量 为 二 分 类 资料 ， 初 步 符 合 有 序 Logistic 回归 ， 
分 析 时 注意 平行 性 检验 , 平行 性 检验 目的 是 验证 自 变量 不 同 取 值 对 因 变 量 影响 系数 相同 ， 
如 果 不 同 ， 则 认为 不 可 以 进行 有 序 Logistic 回归 。 

1. 打开 数据 ， 分 析 一 回归 一 有 序 (D) ， 如 图 17-12 所 示 ， 将 疗效 因 变 量 CD) ， 协 
变量 (C) 放 入 性 别 与 治疗 方法 。 注 意 协 变量 框 放 入 的 是 连续 性 计量 资料 ， 二 分 类 资料 
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和 等 级 资料 ， 如 果 是 无 序 多 分 类 资料 放 入 因子 (F) ， 


图 17-12 有 序 回 归 


3. 结果 解读 : 


区 


变量 三 个 级 别 的 分 布 ， 图 17-14 (B) 方程 仅 包含 
型 为 25.487，-2 对 数 似 然 比 越 小 越 好 ， 说 明 模型 添加 了 自 变量 项 后 ， 拟 合 变 好 了 ， 最 


拟 合 优 度 统计 {EF]) 

摘要 统计 (8) 

参数 估算 值 亿 ) 

欧 数 估 息 值 的 渐进 相关 性 (CC) 
参数 估 鼻 值 的 渐 近 协 方 差 (V) 


要 勾 选 “平行 线 检验 ”， 如 果 需 要 保存 预测 概率 ， 


步 


加 | 预测 烷 别 概 宰 但 ) 
上 | 实际 类 别 概率 (A) 


加 排除 条 项 常量 多) 


图 17-13 输出 设置 


| 


些 


终 模 型 卡 方 检验 P=0.000<0.05， 说 明 最 终 模 型 是 一 个 有 效 模型 。 
17-15 为 拟 合 优 度 检验 和 伪 R 方 ， 图 17-15 (A) 本 例 拟 合 优 度 的 2 个 检验 尸 均 大 


于 0.05， 效 果 不 住 
伪 R 方 ， 类 似 于 线性 回归 的 RR。 


个 素 希 理 摘要 


疗效 ”显效 32 38.1% 
有 效 1 6 19.0% 
无 效 36 42.9% 
有 效 84 100.0% 
外 大 0 
总 计 84 
B 模型 拟 合 信息 
模型 ” ”-2 对 数 似 然 ” ” 卡 广 自由 度 ” ”显效 性 
仅 截 距 48.354 
最 尝 25.487 22.867 2 0.000 


甘 联 明 数 : 分 对 数 - 


图 17-14 个 案 处 理 摘要 与 模型 拟 合 信息 


15-16 为 参数 估算 与 平行 线 检验 结果 ， 


拟 合 优 度 


17-14 为 个 案 处 理 摘要 与 模型 拟 合 信息 ， 图 17-14 (A) 告诉 我 们 因 
距 时 ，-2 对 数 似 然 比 为 48.354， 最 终 


缺陷 ， 没 有 似 然 比 卡 方 准确 。 图 17-15 (B) 


卡 方 目 由 度 


屋 尔 进 2.624 
侦 差 2.631 
基 联 明 数 : 分 对 数 


的 民 方 


着 克 斯 -斯 奈 尔 0.238 
内 戈 尔 科 0.272 
者 克 法 登 0.130 


估 联 函数 : 分 对 数 。 
图 17-15 


0.623 
0.621 


拟 合 优 度 与 伪 RR 


根据 结果 ， 可 以 得 到 2 个 方程 ， 两 个 方程 
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荫 数 项 不 一 样 ， 系 数 一 致 。 系 数 的 解释 同 前 述 的 Logistic 回归 。 但 需要 注意 的 是 ， 二 项 
Logistic 回归 ， 可 以 直接 得 到 EXP (B) 即 OR 和 95% 可 信 区 间 ， 有 序 Logistic 软件 没有 
该 选项 ， 需 要 手动 或 软件 计算 OR 值 。 平 行 线 检 验 ， 卡 方 =0.674，P=0.714>0.05， 符 合 平 
行 线 假定 ， 本 例 可 以 采用 有 序 Logistic 回归 。 如 果 不 符合 ， 则 需要 把 疗效 等 级 当 作 多 项 
无 序 分 类 进行 处 理 ， 也 了 吏 是 下 一 节 多 项 Logistic 回归 。 


E Peace 显效 
logit (Pro sv 效 ) =logit 


“了 effect= 显效 


——2.40/-—1.133xsex—2.00 /xreat 


E _ 人 effect 显效 十 effect= 有 效 
logit CP effect= 显效 / 朋 效 放 =logit - 


effect= 无 效 


——].149—1.133xsex—2.00 /xtreat 


佑 数 估 算 值 
35% 置信 区 间 
估算 标准 误差 。 ”瓦尔 憩 自由 度 显 才 性 下 限 上 限 
国 值 。 [effect= 1] -2.407 0.575 17.544 1 0.000 -3.534 -1.281 
[effect= 2] -1.419 0.531 7.147 1 0.008 -2.459 -0.379 
位 置 Sex -1.133 0.510 4.937 1 0.026 -2.133 -0.134 
treat -2.007 0.475 17.879 1 0.000 -2.938 -1.077 


天 联 图 数 : 分 对 数 。 


平行 线 检验 ? 


模型 ””-2 对 数 似 然 。 ” 卡 方 自由 度 。 ”显著 性 
原 假 设 25.487 


带 规 24.913 0.674 2 0.714 
原 假 设 指出 ， 位 前 参数 【 幸 率 姑 数 ) 在 各 个 晤 应 类 别 中 相 
同 。 


a. 关联 函数 : 分 对 数 


图 17-16 参数 估算 与 平行 线 检验 


字 17.3 多 项 Logistic 回归 


当 因 变量 为 老大 时 ， 可 用 线性 回归 找 关 系 ， 当 因 变 量 为 老 三 中 的 二 分 类 时 ， 可 用 二 
项 Logsitic 找 关 系 ， 当 因 变 量 为 老 二 等 级 资料 时 ， 可 以 用 有 序 Logistic 回归 找 关 系 ， 当 因 
变量 为 老 三 中 的 多 项 无 序 分 类 时 ， 则 可 以 用 这 节 的 多 项 Logistic 回归 。 在 二 项 Logistic 
归 的 基础 上 ， 多 项 Logistic 回归 基本 思想 是 将 无 序 分 类 选择 一 个 为 对 照 ， 构 成 多 个 二 项 


Loglstic 。 
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案例 实战 

研究 者 随机 抽取 了 三 个 不 同 的 中 学 ， 研 究 不 同性 别 对 学 生 学 习 方式 偏好 的 影响 。 具 
体 见 数据 库 17.3sav。 本 例 有 两 个 目 变 量 ， 年 级 和 性 别 ; 一 个 因 变 量 : 学 习 方式 。 其 中 年 
级 变量 有 3 个 水 平 (1、2、3) ， 人 性 别 有 2 个 水 平 〈1: 男 ，2; 女 ) ， 学 习 方 式 变量 有 3 
个 水 平 〈1: 目 修 、2: 小 组 、3: 上 课 ) 。 要 求 列 出 主要 的 模型 拟 合 的 结果 ; 列 出 主要 的 
参数 估计 的 结果 ， 并 给 出 合理 的 解释 。 

宗 例 解析 

本 例 想 研究 学 习 方 式 的 影 啊 因 系 ， 竺 习 方 式 分 为 3 个 水 平 (1: 目 修 2: 小 组 3: 上 
课 ) ， 这 3 个 水 平 为 无 序 分 类 ， 研 究 影 响 因 系 2 个， 性 别 2 个 水 平和 年 级 3 个 水 平 ， 符 
全 多 项 Logistic 回归 设计 。 

实战 步 又 

1. 打开 数据 库 ， 因 为 有 频数 项 ， 百 先进 行 频 煞 加 权 ， 目 行 操作 

2. 分 析 一 回归 一 多 项 Logistic 回归 ， 如 图 17-17 所 示 ， 将 学 习 方 式 放 入 因 变 量 ， 年 级 
与 性 别 放 入 协 变量 。 一 般 协 变量 放 老 大 、 老 二 和 老 三 中 的 二 分 类 ， 无 序 老 三 放 入 因子 。 


办 条 元 Legistic 回 昌 | 


哆 年 扣 [年 级 ] 了 
戎 性 别 | [人 性别] 


图 17-17 多 元 Logistic 回归 


3. 模型 设置 : 如 图 17-18 所 示 ， 当 不 考虑 因 系 之 间 的 交互 作用 ， 只 考虑 主 效 应 时 选 
择 主 效应 模型 ， 如 条 考虑 因素 之 间 的 交互 作用 则 选择 全 因 了 于 模型 ， 当 因素 较 多 ， 采 用 逐 
步 回 归 时 ， 可 以 选择 定制 步 进 。 本 例 选择 主 效 应 模型 。 统 计 设 置 如 图 17-19 所 示 ， 按 照 
图 中 默认 设置 即 可 。 

4. 结果 解读 

(1) 个 案 摘要 与 模型 拟 合 信息 , 图 17-20 (A) 显示 因 变 量 个 案 数 及 构成 比 , 图 17-20 (B) 
显示 似 然 比 检 验 ， 卡 方 =25.732，P=0.000<0.05， 说 明 构 建 的 模型 有 统计 学 意义 。 


地 守 元 Logistic 回归 : 模型 


指定 模型 


二 主 效应 人 ) 名 主因 子 邮 ) 


时 定制 些 进 {C) 


因子 对 协 变量 人 E) : 
类 中 学 
| 号 性 别 


在 模型 中 包括 截 距 册 |) 


强制 进 人 项 介 ) : 


图 17-18 ”模型 设置 


伪 R 取 值 0 一 1， 越 接近 1 说 


协 民 方 {p) 
步 圣 滴 要 册 ) 
模型 岗 合 信息 避 ) 
壤 息 准 叫 向 


个 章 什 IE) 

蕊 bt 
节 近 相 淆 性 拘 
其 进 协 记 董 返 ) 


症 必 于 群体 
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单元 癌 概 牢 但 ) 
分 尖 表 代 ) 
热合 会 度 {EE) 
单调 性 测 且 (DD) 


置信 区 问 (WW) : [95 | 


筷 由 因子 和 协 弯 量 十 愉 的 协 变量 模式 上 F) 
各 四 以 下 索 量 列表 定 祥 的 协 吉 量 模 蕊 加) 


学校 [中 学 ] 
| 性别 [性别 
区 学 校 中 学 ] 
性 别 [性 另 | 


于 群体 {1) : 


图 17-19 统计 设置 
(2) 伪 R 方 与 似 然 比 检验 图 17-21 (A) 为 伪 R 方 ，3 个 伪 R 方 的 值 均 比 较 小 ， 


月 模型 预测 效果 越 好 。 图 17-21 (B) 为 模型 系数 检验 结果 ， 


发 现 截 距 项 无 意义 ，2 个 自 变 量 年 级 和 性 别 均 有 统计 学 意义 ，P=0.029 和 P=0.000。 


个 素 妈 理 摘要 
帆 好 学 习 方 式 。 自修 124 
小 组 91 
上 课 188 
有 效 403 
缺失 0 
总 计 403 
于 群体 6 
模型 拟 合 信息 . 
模型 拟 合 条 件 
模型 -2 对 数 似 然 民 方 
仅 截 距 82.775 
最 党 5 .043 25.132 


30.8% 
22.6% 
46.7% 
100.0% 


以 然 比 检验 


4 0.000 


图 17-20 个 案 摘 要 与 模型 拟 合 信息 


| 人 雯 RR 方 
攻克 期 -斯 计 尔 0.062 
肉 故 尔 科 0.070 
坦克 法 登 0.030 


似 热 比 愉 验 


柑 型 拟 合 条 件 似 然 比 检 验 

简化 模型 的 -2 
效应 对 数 似 然 卡 方 和 目 由 度 ” 显 者 性 
需 距 57.268 0.225 2 0.894 
年 级 64.145 7.102 2 0.029 
性 别 719.141 18.098 2 0.000 
卡 方 统计 是 最 终 模 型 与 简化 模型 之 则 的 -2 对 数 似 然 之 


荆 :简化 模型 是 通过 在 最 和 终 模 型 中 省 略 某 个 效应 而 形 


成 * 原 假 设 是 : 该 效应 的 所 有 人参 


伪 R 与 似 然 比 检验 
(3) 参数 估算 ， 如 图 17-22 所 示 ， 从 结果 可 以 得 到 2 个 万 程 。 


图 17-21 


Losplt LP 自 收 /上课 ) =—0.220+0.381x 年 级 —0.9090x 性 别 | 
Logit (Pig/ | 识 ) 一 0.055+0.238x 年 级 -0.806x 性 别 


数 均 为 0 
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Logistic 回归 方程 实际 意义 不 大 ， 更 重要 在 于 OR 值 的 解释 。 以 方程 自修 为 例 ， 发 现 
年 级 每 升 高 1 个 年 级 ， 选 择 自修 的 风险 是 上 课 的 1.463 倍 ， 意 即 高 年 级 学 生 更 愿意 自修 ; 
性 别 每 增加 一 个 等 级 ,也 就 是 女生 ,相对 于 上 课 而 言 ， 选 择 自修 的 风险 是 男生 的 0.403 倍 ， 
意思 是 女生 喜欢 上 课 而 不 是 自修 。 


= EXp(B) 的 95% 置信 区 则 
下 限 上 限 


17-22 ”参数 估算 


守 17.4 条 件 Logistic 回归 


在 设计 阶段 ， 为 了 控制 潜在 混杂 因素 的 干扰 、 提 高 优势 比 的 估计 精度 ， 对 每 一 个 符 
合 入 组 条 件 的 病例 ， 按 照 配 比 因素 〈( 即 混杂 因素 〉 寻找 一 个 或 几 个 非 病例 作为 对 照 ， 然 
后 比较 病例 和 对 照 各 自 以 往 的 暴露 经 历 ， 进 行 分 析 。 正 如 我 们 前 面 学 过 配对 上 检验 、 配 
对 设计 四 格 表 资料 卡 方 检验 一 样 ， 如 果 采 用 的 是 配对 【或 配 比 ) 设计， 研究 多 个 因素 对 
二 分 类 因 变 量 的 影响 ， 则 可 以 采用 条 件 Logistic 回归 人 分析。 条件 logistic 回归 模型 表达 为 : 

logit 已 =D1xxl+ Pp2xx2+***+ mxxm。 

案例 实战 

有 研究 者 采用 1 : 1 匹配 ,研究 感冒 与 接种 流感 疫苗 、 吸 烟 的 关系 , 尝试 进行 统计 分 析 ， 
数据 见 datal17.4。 注 : 本 例 为 虚构 数据 ， 仅 用 于 演示 SPSS 分 析 方 法 ， 变 量 赋值 为 
感冒 (0: 未 感冒 ，1: 感冒 ) ， 吸 烟 (0: 不 吸烟 ，1: 吸烟 ) ， 接 种 疫苗 “0: 接种 ，1: 
未 接种 ) 。 

案例 解析 

本 例 采 用 1 : 1 匹配 ， 因 变量 为 是 否 感 冒 ， 自 变量 为 吸烟 与 接种 流感 疫苗 。SPSS 中 
实现 条 件 Logistic 较为 复杂 ， 但 通过 COX 回归 实现 则 较为 简单 ， 本 例 采 用 COX 回归 实 
现 ，COX 回归 实现 条 件 Logistic 回归 的 格式 务必 参照 图 17-23, 该 图 加 框 部 分 为 一 个 对 子 ， 
其 中 一 个 为 病例 感冒 ， 一 个 为 对 照 ， 最 后 还 需 增 加 一 个 虚拟 的 时 间 变 量 ， 并 且 让 对 照 的 
时 间 为 2， 病例 时 间 为 1。 
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1 
| 0 
2 11 | 1 | 1 

1 2 0 0 1 2 
国 号 ] 1 1 ] 
6 了 0 0 0 2 
了 1 1 1 1 
总 4 0 1 0 2 
9 9 1 1 0 1 
10 9 0 1 0 2 


图 17-23 条件 Logistic 回归 COX 实现 的 数据 格式 


1. 打开 数据 ， 分 析 一 生存 分 析 一 COX， 如 图 17-24 所 示 ， 将 虚拟 时 间 放 入 时 间 框 ， 
痊 状 态 变 旺 用 入 古 全 感冒 ”, 并 定义 结局 状态 为 1, 将 接种 疫苗 与 是 否 吸 烟 放 入 协 变 量 框 。 
2. 选项 设置 ， 如 图 17-25 所 示 ,， “人 义 选 Exp(B) 的 置信 区 间 ”。 扣 击 “ 继 续 ”“ 确 定 ” 


= 下- 和 步 进 枉 灾 


[Bs | %| 进入: [05 | B 去 思 ， 


Rss 


食 在 是 后 一 小 步 劝 仙 ) 同 | 显示 基线 函数 ( 昌 ) 


图 17-24 COX 回归 图 17-25 ”COX 回归 - 选项 设置 


3. 结果 解读 : ei COX 回归 方法 实现 条 件 Logistic 回归 ， 故 仪 看 主要 结 
果 ， 其 他 结果 请 参见 生存 分 析 章 节 。 如 图 17-26 所 示 ， 本 例 未 发 现 吸烟 与 感冒 的 关系 ， 
P=0.068, eign P=0.012，EXP (B) 即 OR=2.858， 即 未 接种 流 


感 疫 苗 的 人 群 得 流感 的 风险 是 接种 流感 人 群 的 2.858 倍 。 
方程 中 的 变量 
95.0% Exp(B) 的 CI 
B SE 瓦尔 德 ”自由 度 “外 显著 性 (B) 站 下 限 上限 
是 理 吸 烟 0.618 0.339 3.331 | 0.068 1.855 0.955 486802 
是 否 接 可 某 疫 苗 1.050 0.417 6.330 1 0.012 2.858 1.261 6.475 


图 17-26 COX 方程 结果 
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1. Logsitic 的 具体 种 类 ， 二 项 Logistic 回归 ， 有 序 Logistic 回归 ， 多 项 Logsitic 回归 
和 条 件 Logistic 回归 ， 最 重要 的 是 二 项 Logistic 回归 。 一 是 因为 最 常用 ， 二 是 因为 其 是 理 
解 后 续 Logistic 回归 的 基础 。 有 序 Logistic 回归 和 多 项 Logsitic 回归 其 实 就 是 拆 分 为 多 个 
二 项 Logistic 回归 , 只 不 过 有 序 Logistic 回归 是 累积 式 拆 分 法 [以 职称 为 例 , 高 级 / 非 高 级 ， 
(高 级 + 中 级 ) /初级 ]， 而 多 项 Logsitic 回归 直接 是 多 对 一 的 拆 分 法 【以 血型 为 例 ，A/O， 
B/O, AB/O) 。 

2. 线性 回归 我 们 更 注重 回归 方程 ， 得 到 变量 间 的 数量 依存 关系 ，Logistic 回归 我 们 更 
关注 发 现 风 险 因 系 ， 根 据 OR 值 判 别 。 

3. 目前 ，Logistic 回归 建 模 理论 上 也 是 先 单 因素 ， 在 发 现 有 意义 变量 的 基础 上 ， 再 进 
行 多 因素 分 析 。 同 时 当 研 究 的 自 变 量 个 数 不 是 很 多 时 ， 可 以 将 多 个 自 变 量 直接 放 入 模型 
进行 检验 ， 无 须 进行 单 变量 检验 筛选 这 一 步 。 

4. 几 种 可 能 的 情况 

(1) 单 因 素 分 析 有 意义 ， 可 是 多 因素 分 析 没 意义 了 ， 这 叫 “ 单 有 多 无 ”， 单 因素 有 
意义 并 不 能 代表 该 因素 与 了 肯定 有 意义 ， 很 可 能 该 因素 在 别 的 因素 作用 下 ， 才 与 YY 有 关 
系 的 。 如 小 4 和 小 BB 是 工厂 工人 人 ， 小 4 一 天 生产 60 双 鞋 子 ， 小 BB 一 天 生产 60 双 鞋 子 ， 
现在 工厂 搞 技能 大 比拼 。 小 4 参加 了 ， 小 B 没 参加 ， 小 B 把 自己 一 天 的 60 双 鞋 子 的 工 
作 量 给 了 小 4， 小 4 就 有 了 120 双 鞋 和 子 ， 于 是 小 4 评 上 了 技术 能 手 。 第 二 年 又 比赛 了 ， 
小 4 和 小 B 都 参加 了 ， 小 B 没 有 把 自己 工作 量 给 小 4， 所 以 小 4 就 没有 评选 上 。 第 一 年 
小 4 被 评 上 ， 是 因为 背后 有 小 B 的 功劳 ， 当 扣除 B 的 影响 之 后 ， 小 4 也 就 是 几 人 一 个 了 ， 
没 意 义 了 。 所 以 , 我 们 单独 研究 某 个 因素 的 时 候 , 所 得 到 的 结果 , 很 可 能 掩盖 了 一 些 信 息 ， 
当 扣 除 这 些 信息 后 ， 结 论 可 能 颠覆 
(2) 单 无 多 有 ， 即 单 因 素 分 析 无 意义 ， 可 是 多 因素 分 析 时 ， 该 因素 却 有 意义 了 。 如 

小 4 平时 学 习 挺 努力 ， 可 是 今天 考试 考 磺 了， 别人 都 认为 小 4 学 习 成 绩 不 太行 ， 可 事实 
是 小 4 昨天 助人 为 乐 ， 帮 助 一 个 摔跤 的 老 太 太 ， 送 老 太 太 到 医院 并 在 医院 守候 一 夜 没 有 
休 轧 ， 第 二 天 早晨 来 到 学 校 参 加 考试 的 ， 如 条 没有 老 太 太 因素 的 干扰 ， 即 扣除 该 因素 的 
影响 ， 将 其 也 放 入 模型 ， 则 小 4 的 成 绩 就 能 体现 出 来 。 所 以 统计 分 析 还 是 多 因素 分 析 的 
结果 更 为 可 信 。 

5. 当 我 们 进行 多 个 影响 因素 筛选 时 的 方法 如 上 ， 可 是 有 时 我 们 就 想 知道 某 因 素 4 对 
结局 了 的 影响 大 小 ， 此 时 建 模 时 ，4 必须 进入 模型 ， 其 他 因素 进入 模型 的 依据 很 多 时 候 
不 再 是 P<0.05， 而 是 当 因素 B 进入 与 不 进入 模型 ， 如 果 因 素 4 的 系数 变化 大 于 10%， 则 
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此 因素 B 必须 进入 模型 进行 控制 ， 这 也 是 近年 SCI 高 分 论文 的 常见 做 法 。 

6. 条 件 Logistic 回归 用 于 探索 危险 因素 的 效率 较 高 ， 但 不 适合 进行 发 病 预测 ， 因 为 
匹配 后 的 数据 ， 己 经 不 是 来 自 现 场 的 真实 数据 。 

7. 经 常 ， 我 们 在 SCI 论文 时 ， 统 计 分 析 有 P for trend， 一 般 都 用 于 进行 回归 分 析 时 ， 
用 于 识别 判定 自 变 量 与 因 变 量 的 线性 趋势 关系 。 常 见于 Logistic 回归 ，COX 回归 ， 以 及 
线性 回归 。 目 变量 本 身 为 计量 资料 。 为 什么 要 这 样 做 呢 ? 你 肯定 会 问 ， 目 变量 本 身 就 是 
计量 资料 ， 为 什么 不 能 直接 代入 模型 进行 分 析 ， 线 性 回归 结果 解释 为 自 变 量 每 增加 1 个 
单位 ， 了 改变 多 少 单 位 (线性 ) ; Logistic/COX， 为 自 变 量 增加 1 个 单位 ， 结 局 事件 发 生 
的 风险 (OR/HR)〉。 很 多 的 时 候 自 变量 增加 1 个 单位 ， 了 未 必 有 太 大 的 变化 或 风险 ， 如 
17-27 所 示人 微 球 重 白 增加 1mg/L 的 时 候 ， 疾 病 发 生 风 险 很 可 能 并 未 有 多 少 变化 。 


OR 【95 全 C1) P Value for 


Trend 
Ql Wz 3 Q4 
(n = 151) (n = 117) Im = 105) (n = 88) 
Model 1: crude, no adjustment 1.0 0.68 (0.42-1.12) 0.59 (0.36— 0.98) 0.A0 10.23-_0.69) 0.0007 
P Values ). lL : 
Model 2: adjusting for age, gender, body mass index 1.0 0.777 (0.463_1.302) 0.603 (0.356-1.023) 0.476 (0.270_0.838) 0.006 
P Values 0.338 D061 DO.DL 
Model 3: adjusting for age, zender, body mass index, 1.0 0.79 (0.46-1.34) 0.60 (0.35—1.04) 0.54 (0.30—0.81) 0.018 
smoking, alcohol, and family history of coronary 
heart disease 
p Values 0.38 0.07 0.03 
Model 4: adjusting for age, gender, body mass index, 1.0 0.738 (0.361-1.506) 0.495(0241-1.018) 0.497710.215—1.006) 0.02 
smoking, alcohol, and family history of coronary 
heart discase plus biochemical misk factors low- 
density lipoprotem, high-density lipoprotein, tri- 
glyceride, and diabetes 
p Values 0.403 0.056 0.032 


图 17-27 PP for trend 讲解 


为 了 增加 模型 发 现 风险 的 能 力 ， 对 于 年 龄 ， 有 时 候 我 们 将 10 岁 划 分 为 1 组 ; 然而 对 
于 一 些 生 化 指标 ， 怎 么 划分 呢 ? 于 是 我 们 采用 四 分 位 数 间距 〈Q) ， 我 们 将 自 变 量 X 以 
四 分 位 数 间距 进行 分 组 ， 可 以 分 为 4 组 ， 我 们 Q,=1; Q,=2; Q,=3; Q,=4， 见 图 17-27; 
其 中 的 Pfortrend 值 , 它 是 怎么 计算 出 来 的 呢 ? 就 是 将 原始 的 x 转 化 为 等 级 变量 ，1、2、3、 
4 代入 模型 ， 以 1 为 参照 ，Logistic 回归 得 到 的 尸 值 就 是 Pfortrend。 图 17-27 中 的 第 二 行 ， 
还 有 一 个 尸 值 ， 这 是 怎么 算 的 呢 ? 试想 ， 咱 们 和 赁 什么 认为 蕊 和 了 之 间 是 线性 的 呢 ? 万 一 
不 符合 线性 ， 咀 们 非 要 按照 等 级 的 线性 进行 分 析 ， 那 是 不 对 的 。 为 了 保险 起 见 ， 我 们 还 
要 把 等 级 的 (1、2、3、4) 再 次 当 作 分 类 变量 ， 设 置 哑 变 量 进 入 模型 进行 分 析 ， 以 1 为 
参照 ， 就 又 可 以 得 到 3 个 对 比 的 P 值 。 

8. 很 多 时 候 ， 文 章 中 还 会 出 现 Per 1 Sd，Per 1 sd 是 指 原始 数据 每 升 高 1 个 标准 差 ， 
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效应 量 发 生 的 风险 ， 本 例 为 BR。 可 是 这 是 怎么 实现 的 呢 ? 1 个 标准 差 是 多 少 昵 ? 怎么 实 
现 这 样 的 统计 分 析 呢 ?统计 其 实 就 是 这 样 ， 看 着 很 喀 人 ， 一 旦 告诉 你 ， 你 就 会 说 ， 哦 ! 
原来 这 么 简单 ! 像 魔 术 一 样 ， 不 知道 答案 认为 很 高 深 ,知道 答案 ， 只 会 觉得 自己 智商 低 ， 
被 骗 了 ! Per 1 sd 的 实现 ， 其 实 就 是 把 原始 数据 进行 标准 人 化， 另存 为 一 个 新 的 变量 ， 新 
变量 荆 因 为 是 被 标准 化 后 的 数据 ， 因 此 其 均 数 和 标准 差 为 0 和 1。 然后 让 并进 入 模型 进 
行 分 析 。 请 问 大 家 此 时 瑟 每 增加 1 个 单位 ， 效 应 量 增加 的 风险 为 HR。 因 为 标准 差 为 1， 
此 时 卫 增 加 1 个 单位 ， 就 是 Per 1 sd。1=Per 1 sd。 就 是 自 变 量 每 增加 1 个 标准 差 。 你 明 
日 了 吗 ? 

9. 同 级 对 等 原则 : 这 是 松 哥 经 验 ， 在 建立 回归 模型 时 ， 如 果 了 为 计量 资料 ， 此 时 式 
为 计量 资料 分 析 的 效果 会 比较 好 ， 当 然 当 了 为 计量 , 卫 可 以 为 任何 形式 ， 当 了 为 等 级 资料 ， 
此 时 针 为 等 级 效果 或 分 类 会 较 好 ; 当 了 为 二 分 类 ， 此 时 蕊 为 等 级 或 分 类 效果 较 好 。 很 多 
国外 的 文章 ， 当 了 为 二 分 类 时 ， 虽 然 蕊 实际 为 计量 ， 研 究 者 会 让 其 以 计量 形式 、 等 级 形 
式 进 入 模型 进行 分 析 ， 然 后 讨论 结果 ; 当 了 为 二 分 类 时 ， 虽 然 卫 实际 为 等 级 ， 研 究 者 会 
让 其 以 等 级 形式 和 分 类 的 形式 进入 模型 进行 分 析 ， 然 后 讨论 结果 。 大 家 细 细 体会 其 中 的 
意味 吧 ! 


ps > 第 18 草 


>》 


有 一 个 医生 4 治疗 COPD 的 有 效率 为 80%， 而 医生 B 治疗 COPD 的 有 效率 为 60%， 
经 过 成 组 四 格 表 资 料 卡 方 检验 , P<0.05, 因此 可 以 得 出 两 个 医生 治疗 COPD 的 疗效 有 差别 ， 
甚至 可 以 得 出 医生 4 的 疗效 要 优 于 医生 B 的 结论 。 貌 似 一 点 问题 都 没有 ， 一 切 都 是 那么 
完美 ， 但 是 如 果 松 哥 告 诉 你 ， 医 生 4 虽然 治疗 有 效率 为 80%， 可 是 治疗 了 12 个 月 才 达 
到 效果 ， 而 医生 B 虽然 只 有 60%， 但 仅 是 治疗 2 个 月 就 达到 疗效 呢 ? 似乎 上 面 的 结论 就 
不 再 那么 肯定 了 。 

我 们 前 面 所 学 习 的 方法 ， 只 关注 研究 结果 与 影响 因素 ,并 没有 关注 结局 发 生 的 时 间 ， 
而 时 间 是 一 个 绕 不 开 的 因素 ， 当 我 们 将 研究 结局 与 结局 发 生 的 时 间 同 时 进行 考虑 时 ， 所 
采用 的 分 析 方 法 , 就 叫 作 生存 分 析 。 很 多 人 听 到 生存 分 析 , 认为 只 是 在 生物 医药 领域 应 用 ， 
其 实 不 是 ， 该 方法 应 用 广泛 ， 甚 至 金融 、 电 信和 领域 丝 可 应 用 。 


字 18.1 生存 分 析 概 述 


生存 分 析 ， 是 一 种 将 生存 时 间 和 生存 结果 综合 起 来 对 数据 进行 分 析 的 一 种 统计 分 析 
方法 。 生 存 分 析 源 于 古老 的 寿命 表 研 究 ， 在 医学 领域 相应 的 数据 主要 来 目 对 随访 事件 的 
研究 。 随 访 资料 的 特点 主要 有 : 存在 截 尾数 据 且 数据 呈正 偏 态 分 布 。 


18.1.1 基本 概念 


1. 生存 时 间 

生存 时 间 指 从 某 个 起 始 事件 开始 ， 到 出 现 我 们 想 要 得 到 的 终点 事件 发 生 所 经 历 的 时 
间 ， 也 称 为 失效 时 间 。 生 存 时 间 具 有 的 特点 : 分 布 类 型 不 确定 ， 一 般 表现 为 正 偏 态 分 布 ; 
数据 中 常 含有 删 失 数据 。 

2. 完全 数据 

完全 数据 指 从 事件 开始 到 事件 结束 ， 观 察 对 象 一 直 都 处 在 观察 范围 内 ， 我 们 得 到 了 
事件 从 开始 到 结束 的 准确 时 间 。 

3. 删 失 数据 

指 在 研究 分 析 过 程 中 由 于 某 些 原因 ， 未 能 得 到 所 研究 个 体 的 准确 时 间 ， 这 个 数据 就 
是 删 失 数据 ， 又 称 为 不 完全 数据 。 产 生 删 失 数据 的 原因 有 很 多 : 在 随访 研究 中 大 多 是 由 
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于 失 访 所 造成 的 ;在 动物 实验 研究 中 大 多 由 于 观察 时 间 已 到 ， 不 能 继续 下 去 所 造成 的 。 

4. 生存 概率 

生存 概率 指 从 某 单位 时 间 段 开始 , 存活 的 个 体 到 该 时 间 段 结束 时 个 体 仍 存活 的 可 能 性 。 

生存 概率 = 下 一 时 段 开始 的 人 数 /该 时 段 开 始 的 人 数 =1- 死亡 概率 。 

5. 生存 函数 

生存 函数 指 个 体 生 存 时 间 7 了 大 于 等 于 t 的 概率 ， 叉 称 为 累积 生存 概率 ， 或 生存 曲线 。 

S (1) =P (7T>b0 = 生存 时 间 大 于 等 于 t 的 病人 数 /随访 开始 的 病人 总 数 。S (1) 为 
单调 不 增 函 数 ，S (0) 为 1 ，S (ce) 为 0。 

6. 半 数 生 存 时 间 

半数 生存 时 间 指 50% 的 个 体 存 活 且 有 50% 的 个 体 死亡 的 时 间 , 又 称 为 中 位 生存 时 间 。 
因为 生存 时 间 的 分 布 常 为 偏 态 分 布 ， 故 应 用 半数 生存 时 间 较 平均 生存 时 间 更 加 严谨 。 

7. 风 险 函数 

风险 函数 指 在 生存 过 程 中 ，t 时刻 存活 的 个 体 在 上 时 刻 的 瞬时 死亡 率 ， 又 称 为 危险 率 
函数 、 瞬 时 死亡 率 、 死 亡 率 和 等。 一般 用 hh (1) 表示 。 

h (7) = 死 于 区 间 〈b5 t+AbD 的 病人 数 /在 1 时 刻 尚 存 的 病人 数 xAt。 


18.1.2 ”生存 分 析 方 法 


按照 使 用 参数 与 否 一 般 可 以 分 为 三 种 。 

(1) 参数 方法 ， 数 据 必 须 满 足 相 应 的 分 布 。 第 用 的 参数 模型 有 : 指数 分 布 模型 、 
Weibull 分 布 模型 、 对 数 正 态 分 布 模型 、 对 数 Logistic 分 布 模型 、Gamma 分 布 模型 。 

(2) 半 参 数 方 法 ， 是 目前 非常 流行 的 生存 分 析 方 法 ， 相 对 而 言 ， 半 参数 方法 比 参数 
方法 灵活 ， 比 非 参数 方法 更 易 解 释 分 析 结 果 。 第 用 的 半 参 数 模 型 为 Cox 模型 。 

(3) 非 参 数 方法 ， 当 数据 没有 参数 模型 可 以 拟 合 时 ， 通 和 常 可 以 采用 非 参数 方法 进行 
生存 分 析 。 常 用 的 非 参 数 模型 包括 寿命 表 法 分 析 和 Kalpan-Meier 方法 。 

目前 生存 分 析 最 常用 的 方法 即 寿 命 表 法 、Kaplan-Meier 法 和 COX 回归 法 ， 我 们 一 直 
在 谈 统计 分 三 级 ， 初 级 说 一 说 ， 中 级 比 一 比 ， 高 级 找 关 系 ， 而 寿命 表 法 就 是 生存 分 析 的 
初级 说 一 说 ，Kaplan-Meier 法 就 是 中 级 比 一 比 ， 而 COX 回归 法 就 是 生存 分 析 的 高 级 找 关 
系 。OK， 闲 话 不 多 说 ， 开 始 吧 ! 


> 18.2 寿命 表 法 


寿命 表 法 适用 于 大 样本 资料 且 事 先 按 照 时 间 段 划分 区 间 ， 再 进行 分 析 ， 可 以 进行 生 
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了 资料 的 描述 性 研究 ， 也 可 以 组 间 比 较 。 
双 例 实 成 
不 医院 对 3 304 例 胃 癌 患 直 


此 计算 骨 癌 患者 术 后 各 年 


案例 解读 


观察 304 例 肯 交 患 者 术 后 ， 随 访 11 年 ， 不 仪 观察 是 人 否 友 生死 亡 ， 而 且 关 注 死亡 
肥 生 的 时 间 ， 应 谣 及 用 生存 分 析 ， 因 为 没有 考 碟 多 组 间 比 较 ， 仪 为 一 组 资料 统计 白 述 ， 
适合 采用 寿命 表 法 。 
实 成 步 又 


在， 因为 里 面 有 频数 项 ， 首 和 匈 进行 加 权 ， 此 步 目 行 操作 。 
2 分 析 一 生存 分 析 一 寿命 命 表 法 ， 如 图 18-1 所 示 ， 将 术 后 年 数 因素 放 入 “时 间 ” 框 ， 
数 9 时间 0 一 10 年 ， 间 隔 为 1 年 ， 填 入 “显示 时 间 间 隔 ” 杠 ， 生 存 情况 放 入 “状态 ” 框 ， 


-比较 第 一 个 处子 的 级 别 - 
全 无 IN) 

全 总 体 (QO) 

全 成 对 (P) 


| 定之 范围 后 
me 按 千 了 人 辐 ) ， 


[定名 接 围 由 | 


图 18-1 寿命 表 设 置 图 18-2 ”寿命 表 选 项 


主要 结果 
(1) 寿命 表 ， 如 图 18-3 所 示 ， 一 般 看 生存 分 析 比 例 与 期 末 累 计生 存 分 析 比 例 ， 以 
时 间 间 隅 1 为 例 ， 生 存 分 机 比例 为 0.93， 其 为 进入 时 间 间 隅 人 数 293 减 去 终 关 事件 数 20 
再 除 以 293 的 结果 ， 反 映 的 是 1 期 的 生存 概率 ， 期 末 累 计生 存 分 析 比 例 为 0.91， 其 为 
(304-20-6) /304， 反 映 的 是 经 过 0 期 和 1 期 后 的 生存 概率 。 注 意 表 左下 角 备 注 了 中 位 
数 生 存 期 为 6.25 年 ， 意 思 是 6.25 年 时 有 1 半 人 死亡 。 
ee 以 图 形 的 形式 显示 和 死亡 事件 的 风险 ， 下 降 的 越 快 说 明 
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才 命 才 
期 未 累计 生存 
进入 时 间 同 隔 。 “时 间 间 卫 内 找 其 末 票 计 生存 ”分析 比 例 的 标 购 率 密度 的 标 风险 率 的 标准 
时 间 问 隔 开 始 时 间 的 数目 宵 的 数目 。 ” 有 风险 的 数目 。 疼 端 事件 数 。 羡 止 比例 。 符 存 分 析 比 例 。 。 分 析 比 例 准 误 基 肚 率 帘 度 准 误 关 风险 率 误 关 
0 304 5 301.500 6 002 0 58 0 96 0 0020 0008 0 07 001 
1 293 8 289.000 20 007 093 0.91 002 0068 0.015 0.07 0.02 
可 265 10 260.000 了 本 D09 口号 0.983 0.02 D0081 0.016 0.09 0.02 
习 232 8 228.000 站 2 0.18 D.82 0.03 D0153 0.022 0.20 0.03 
9 182 2 1981.000 15 D008 D92 0.03 O056 0.014 0.09 口 .02 
5 165 2 16#4.000 过 十 D0.15 0D.85 0D.03 0.091 0.01B 0.16 吕 .03 
6 139 4 137.000 本 了 D0.23 日 .FF 0D.03 [he 0.020 0D.26 0.05 
更 1D3 3 101.500 了 了 D.22 D.r8 D.03 站 站 电台 0.01B DD. 4 D.05 
日 78 0 3.000 25 0.32 D658 0.03 0102 0.019 0.38 口 . 07 
日 | 1 £7 500 1 日 0.36 癌 后 寻 0.02 O0079 O01F 器. D0.10 
10 33 7 29.500 26 088 012 0.01 0000 0.000 0.00 0.00 
a. 生存 分 析 寺 间 中 位 归 为 6.25 
图 18-3 ”和 寿命 表 结 果 
到 0.4 
I 


4 6 
术 后 年 数 
图 18-4 生存 函数 

5. 本 例 中 , 当 我 们 还 考虑 不 同性 别 胃癌 患 者 的 生存 情况 时 , 可 以 将 性 别 放 入 “因子 (F)” 
或 层 (B) ， 如 图 18-5 所 示 ， 操 作 同 前 ， 将 性 别 放 入 “因子 (F) ” 答 ， 放 入 因 于 后， 选 


项 设置 中 ， 可 以 设置 总 体 间 比较 ， 如 图 18-6 所 示 。 


坐 存 分 析 (S) 坐 存 分 析 对 数 (G) 
风险 (H) 密度 侣 ) 


ER 再 加 一 减 生存 分 析 函 数 (M) 
定 必 事 件 (D).. | 


| 挖 身子 提 ) : 


定 炎 范围 内 .| 


图 18-5 ”寿命 表 设置 图 18-6 ”大 命 表 选项 
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图 18-7 显示 ， 数 据 按照 性 别 男 女 产生 两 个 寿命 表 的 结果 。 图 18-8 显示 男性 与 女性 
中 位 数 生 存 时 间 分 别 为 7.67 年 和 5.53 年 。 图 18-9 为 分 性 别 的 生存 函数 ， 图 中 横 线 为 双 
击 后 ， 编 辑 添 加 。 图 18-10 为 不 同性 别 生 存 时 间 比 较 ， 肠 0.000<0.05， 因 此 男女 得 了 上 骨 总 
后 生存 时 间 差 异 有 统计 学 意义 。 


海 汕 表 
期 林村 计生 存 
进入 时 间 同 隔 ”时间 问 隔 志 投 组 末 累 计生 存 ”分 析 比 例 的 标 周 吝 帘 众 的 标 风险 刺 的 标准 
价 控制 时 间 则 隔 开始 时 间 的 数目 销 的 数目 。 ” 有 风险 的 数目 。 终 诺 事件 数 。 这 止 比例 。 主 存 分 析 比例 。 ”分 析 比 例 准 误差 。。 者 率 密度 。 ”” 准 识 莽 风险 率 误差 
性 别 0.00 0 129 5 126.500 1 0.01 0.39 0.99 0.01 .O08 0.009 0Q.01 0.01 
1 123 8 119.000 5 0.04 U.S .95 0.02 0 .0d2 0.019 0D.0d 0.02 
2 110 10 105.000 B 0.08 0.92 0.88 0.09 0.072 0.025 .08 1.0 
3 92 日 BB6.000 5 0.0 器 .4 0.83 0.0d g.050 0.022 口 .0 后 0 .0 
二 ?9 2 B.DU B 0.10 U.50 QD.T4 0.0d .095 0.029 0.11 0.04d 
5 后 昌 可 BB.000 各 0.10 0.80 OBr 0.05 .077 0.029 口 4 1 .0 
白 B60 二 S86.000 B 日 .1 4 .B86 0.5r 0.05 0.092 0.031 0.15 0.05 
下 4B 3 46.500 日 0.19 U.81 .#46 0.05 .111 0.035 0.21 0.0r 
吕 36 35.500 日 0.25 0.75 D0.35 0.05 0.1148 0.036 0.29 0.10 
电 26 1 25.500 9 0.35 0.55 D22 0.0s yg.122 0.039 0.43 0.149 
10 16 1 15.500 15 0.a7 0.03 a.01 0.01 口 .0 0.000 .un DU.00 
1.00 0 17B 0 17B.000 5 0.03 口号 7 Ogr 0.01 0.028 0.019 0.03 0.01 
1 171 0 171.000 15 0.09 0.91 .989 0.02 .0gs 0.021 0.09 0.02 
2 156 0 156.000 15 0.10 DQ.S0 .90 0.09 J.095 0.021 0.10 0.04 
习 1 41 0 1#d41 .000 37 DD.26 口语 D0.59 0.0d 0.210 0.031 0.30 0.05 
二 D4 0 104.000 和 0.07 0.93 0.55 0.0d 0.040 0.015 OOr 0D.09 
5 gr 0 97.000 17 .18 .82 口 .4 与 0.0d U.097 0.022 QO.19 .0 
记 80 0 S80.000 了 站 .3 站 0D. 0.32 0.Dd 0.136 D.0268 0.35 日 .0 
下 sb 0 SB.0D0 13 0D.23 Orr QO.24 0.09 0.07d 0.020 0.26 DOr 
吕 了 | 口 43.000 16 0.37 .63 D0.15 0.03 0.091 0.022 口 .4 后 0.11 
日 27 0 27.000 10 D.37 0.63 0.10 0.01 O05 D.D1Y 0.45 日 .4 可 
0 17 6 14.000 11 0.79 0.21 O02 0.01 Ud.000 0.000 Qun 0D.00 


图 18-7 寿命 表 结 果 


生存 分 析 函 数 


1.0| 一 性 询 
一 0.00 
-1.00 


一 
Cn oo 


累积 生存 分 析 
下 


针对 控制 变量 的 比较 : 性 别 


Oo 
iD 


侍 存 分 析 时 间 中 位 效 


总 体 比 较 ” 
阶 控 剂 时 间 中 位 将 0.0 误 尔 科 直 森 
SI ess 吉 享 ) 统计 自由 度 显著 性 
ee :三 | DA er TO 
性别 0.00 7 .67 0 2 8 10 18.810 1 0.000 


EE a 术 后 年 数 9. 执行 的 是 精确 比较 ; 
图 18-8 生存 时 间 中 位 数 图 18-9 生存 函数 图 18-10 不 同性 别 生 存 时 间 比 较 
注意 ， 在 寿命 表 分 析 时 ， 因 子 (F ) 与 层 ( B ) 效果 一 样 ， 本 例 将 性 别 分 别 放 入 两 处 
进行 分 析 结 果 一 致 。 在 SPSS 中 ,因子 (F ) 的 作用 类 似 于 拆 分 文件 中 的 比较 组 ; 层 (B 
类 似 于 拆 分 文件 中 的 按 组 组 织 输出 。 
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> 18.3 Kaplan-Meier 法 


当 研 究 的 数据 不 再 是 区 组 格式 ， 而 是 单条 记录 格式 ， 并 且 考 虑 不 同 分 组 之 间 生 存 效 
果 的 比较 时 ， 可 采用 Kaplan-Meier 法 。Kaplan-Meier 法 利用 概率 乘法 定理 计算 生存 率 ， 
又 称 乘积 极限 法 ， 适 用 于 小 样本 或 大 样本 未 分 组 资料 的 分 析 。 

案例 实战 

某 医 院 对 50 例 某 病 患 者 随机 化 分 组 后 ， 一 组 为 对 照 组 ， 一 组 为 实验 组 ， 实 验 组 
采用 采种 干预 措施 ， 对 照 组 不 采用 任何 干预 措施 ， 观 察 患者 生存 时 间 。 试 通过 Kaplan- 
Meier 法 进行 生存 分 析 ， 要 求 评价 干预 措施 有 无 效果 ? 同时 绘制 生存 曲线 图 。 有 具体 数据 见 
16.2.sav 数据 库 。 

案例 解读 

本 例 数据 为 按照 每 个 个 案 结 果 记 录 ， 即 每 行 就 代表 1 个 病人 ， 并 记录 病人 的 结局 和 
出 现 结局 的 时 间 ， 同 时 考虑 了 一 个 分 组 因素 ， 先 欲 比 较 2 组 疗效 是 否 有 差别 ， 属 于 生存 
分 析 的 中 级 比 一 比 ， 适 合 采 用 Kaplan-Meier 法 。 本 例 组 别 (1: 试验 组 ，2: 对 照 组 ) 、 
时 间 单 位 为 月 ， 生 存 情 况 (0: 死亡 ，1: 删 失 ，2: 试验 结束 时 仍 存活 ) 。 

操作 步骤 

1. 分 析 一 生存 分 析 一 Kaplan Meier 法 ， 如 图 18-11 所 示 , 将 生存 时 间 放 入 “时 间 ” 框 ， 
生存 情况 放 入 “状态 ” 框 ， 组 别 放 入 “因子 ” 框 。 

2. 比较 因子 : 如 图 18-12 所 示 ，SPSS 提供 了 3 种 组 间 比 较 的 方法 ，〈1) 秩 的 对 数 : 
用 于 检验 各 组 的 生存 分 布 是 否 相 同 ， 各 时 刻 赋予 相同 的 权重 ; (2) 布雷 斯 洛 (Breslow) : 
用 于 检验 各 组 的 生存 分 布 是 否 相 同 ， 各 时 刻 按 个 案 数 赋 予 权 重 ; (3) 塔 罗 内 - 韦 尔 
(Tarone-Ware) : 用 于 检验 各 组 的 生存 分 布 是否 相 同 , 各 时 刻 按 个 案 数 的 平方 根 赋予 权重 。 
“因子 水 平 的 线性 趋势 ”用 于 检验 因素 变量 的 水 平 间 是 否 存 在 线性 趋势 , 此 选项 只 有 在 “ 因 
子 ” 框 中 的 变量 为 有 序 变 量 时 才 有 实际 意义 , 如 疾病 的 严重 程度 轻 、 中、 重 。 在 此 种 情况 下 ， 
系统 默认 各 水 平 间 的 效应 是 等 距 的 。 

3. 结果 解读 

(1) 个 案 处 理 摘 要 ， 如 图 18-13 所 示 ， 显 示 2 组 人 数 与 事件 数 。 

(2) 生存 分 析 表 : 如 图 18-14 所 示 ， 分 组 显示 生存 数据 ， 由 于 数据 较 长 此 处 只 展现 
部 分 。 
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ET] 
HT al 1 | i Er rn 
| 少 生存 时 间 [ 月 ) [生存 时 .| 疡 0 
i [| 
生存 情况 0 选项 好] | Kaplan-Meler 8 比 园 固 地 级别 
Ew | | | 


因子 轨 列 的 站 性 趋势 [[) 
重 在 层 之 间 汇 聚 上 四) 站 在 属 之 间 成 对 比较 人 P) 
全 针对 每 个 层 候 ) 加 守 对 每 个 必 成 对 比较 (R) 


图 18-11 Kaplan-Merier 设置 图 18-12 ”比较 因子 级 别 
个 案 然 理 摘要 
检 风 后 
-组 别 总 数 事件 数 个 率 数 日 分 比 _ 
prednisolone 组 295 11 14 56.0% 
对 昭 组 25 23 2 8.0% 
总 体 50 34 16 32.0% 


图 18-13 ”个案 人 处 理 摘要 


生存 分 析 琢 
当前 累计 生存 分 析 比 例 
组 别 时 条 ] 状态 估算 标准 误 苹 累积 事件 数 ”其 余 个 案 笋 
prednisolone 骨 1 2.000 出现 请 局 0.960 0.039 1 24 
2 6.000 出现 请 局 0.920 0.054 2 23 
3 12.000 出 现 靖 局 0.880 0.065 3 22 
4 54.000 出现 结局 0.840 0.073 4 21 
5 56.000 竹 和 失 . . 下 20 
6 68.000 出现 结局 0.798 0.081 5 19 
i 89.000 出现 靖 局 0.756 0.087 6 1 日 
6 96.000 出 现 闭 局 . l 7 17 
9 96.000 出 现 结 局 0.672 0.095 8 16 
10 125.000 ”试验 鳃 东 时 们 8 15 
存活 
11 128.000 试验 结束 时 仍 ， ， 9 1 起 
存活 
12 131.000 试验 线束 时 全 | . 日 13 
仔 活 
1 140.000 ”试验 铺 东 时 仿 . 8 12 
14 141.000 ”试验 结束 时 全 ， 9 1 
存活 
15 143.000 出现 结局 0.611 D0.104 9 10 
16 145.000 试验 铺 东 时 们 . 9 
人 存活 
17 146.000 出 现 闭 局 0.543 0.113 10 8 
18 148.000 试验 结束 时 全 ， 10 i 
三 二 


图 18-14 生存 分 析 表 


(3) 生存 分 析 平 均值 和 中 位 数 ， 由 图 18-15 可 知 ， 实 验 组 的 生存 时 间 均 值 和 中 位 数 
均 高 于 对 照 组 ， 因 为 生存 分 析 数 据 一 般 不 符合 正 态 分 布 ， 因 此 中 位 数 描述 较为 准确 。 
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生存 分 析 时 和 间 的 平均 值 和 中 位 涩 


35% 置信 区 间 
组 列 标准 齐 善 下 限 上 限 
pradnisolone 肖 1 本 .本 和 109.04d4 157.709 , ， ， 
对 上 申 组 13.915 52.527 107.073 17.496 19.727 88.273 
总 体 10.236 B87.041 127.166 34.298 59.795 194.205 


a. 如 果 已 对 生存 征 卫 困 辣 品行 检 吊 ,那么 估算 将 限于 最 大 生存 分 析 时 间 


图 18-15 ”生存 时 间 均 值 与 中 位 数 


(4) 总 体 比 较 : 三 种 方法 比较 结果 ，Log Rank 卡 方 =7.163，P=0.007<0.05，Breslow 
和 Tarone-Ware 卡 方 的 P 值 均 小 于 0.05。Log Rank 检 验 给 结局 事件 的 远 期 差别 更 大 的 权重 ， 
即 对 远 期 差异 敏感 ， 而 Breslow 检验 给 结局 事件 的 近期 差别 更 大 的 权重 ，Tarone-Ware 介 
于 两 者 之 则 。 因 此 ， 对 于 一 开始 烙 在 一 起 ， 随 看 时 间 的 推移 越 拉 越 开 的 生存 曲线 ，Log 
Rank 检验 较 Breslow 检验 容易 得 到 差异 有 显著 性 的 结果 ; 反之 ， 对 于 一 开始 相差 较 大 ， 
随 着 时 间 的 推移 反而 越 来 越 近 的 生存 曲线 ，Breslow 法 容易 得 到 差异 有 显著 性 的 结果 。 一 
般 Log Rank 和 Breslow 使 用 较 多 。 


卡 方 自由 度 显著 性 
LogRank(Mante}-Con) 7163 1 0007 
Breslow (Generalized Wilcoxon) 1.516 1 0.006 
Tarone-Ware 1.631 1 0.006 


针对 组 别 的 不 同 级 别 进行 的 生存 分 析 分 布 等 同性 检验 。 
图 18-16 组 间 比 较 
(5) 生存 曲线 : 由 图 18-17 可 见 并 且 两 条 曲线 分 开明 显 ， 试 验 组 下 降 趋 势 小 于 对 照 
组 ， 试 验 组 的 生存 率 要 高 于 对 照 组 。 


生存 分 析 图 数 
组 别 
mprednisolone 组 
了 对照 组 
+ prednisolone 组 - 检 易 后 

0 ,对照 组 - 检 别 后 
+ 
飞 0.4 
Ek 

0.2 

0.0 

0 100 150 200 


50 
生存 时 间 (月 ) 
图 18-17 生存 曲线 
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知识 拓展 
(1) 当 Kaplan-Meier 法 将 组 别 放 入 “ 层 (A)” 时 , 则 相当 于 按照 组 别 对 a 
分 别 分 析 每 一 A | 
(2) 当 组 别 放 入 “ ET ”时 , 才 可 以 进行 组 间 比 价 , 当 因 了 
如 病情 轻 、 中 和 如 开 究 是 否 上 共有 线性 趋势 ， 则 可 以 义 选 


加 广 层 之 间 成 对 比较 ( 
全 针对 每 个 层 成 pt (RR) 


图 18-18 ”Kaplan-Meier 层 设置 图 18-19 9 比较 因子 级 别 


当 生 存 曲线 人 存在 区 文 时 ， 则 不 再 是 等 比例 风险 模型 ， 不 再 适合 上 述 方法 ， 
R 软件 Landmark 程序 ，SPSS 暂 不 能 实现 。 
(3) 图 18-14， 如 何 得 出 5 年 生存 率 ， 图 中 无 60 个 月 对 应 数据 


近 的 54 个 月 。 得 到 5 年 生存 率 近似 值 为 0.840。 


当 影 啊 结 局 友 生 的 因 系 较 多 ， 并 且 我 们 不 仅 仪 想 知 坦 不 同 因 系 4 
寞 ， 就 像 Logistic 回归 一 样 ， 而 且 想 知道 每 个 因素 对 结局 发 生 的 风险 
法 将 不 再 适用 ， 而 针对 生存 分 析 的 回归 方法 ， 最 常用 的 就 是 Cox 本 i Cox 回归 模型 是 
假定 因素 对 死亡 风险 作用 强度 在 所 有 时 间 上 都 保持 一 致 的 前 提 下 进行 的 。 对 于 不 满足 此 
前 提 条 件 的 ， 需 要 用 到 下 一 节 的 时 间 依存 变量 Cox 模型 。Cox 回归 模型 能 
间 与 危险 因素 之 间 依 存 关 系 的 数学 模型 。 
案例 实战 
条 人 研究 者 想 研 究 肺 瘤 四 种 亚 
要 求 列 出 Cox 回归 模型 的 主 村 
案例 解析 


a 列 ， 收集 了 一 些 肺 瘤 病例 的 数据 。 


结局 变量 包括 存活 时 间 与 生存 状态 ， 影 响 因素 包括 
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思维 | 
性 别 和 年 龄 。 其 中 肺癌 类 型 为 无 序 多 分 类 ， 应 该 设置 哑 变 量 。 

1. 分 析 一 生存 分 析 一 Cox 回归 ， 如 图 18-20 所 示 ， 将 “生存 时 间 ” 放 入 “时 间 ” 框 ， 
“生存 状态 ” 放 入 “状态 ”和 框 。 单 击 “ 定 义 事件 ”在 “ 单 但 ” 框 中 填 入 “1”， 单 击 “ 继 续 ” 
按钮 返回 主 界面 。 将 其 他 的 各 因素 全 部 选 入 “ 协 变 量 ” 杠 中 。“ 方 法 ” 框 中 本 例 选 择 “ 进 
入 ”方法 , 不 同 的 数据 初步 分 析 后 可 以 选择 相应 的 方法 , 当 自 变量 个 数 较 多 时 建议 选择 “加 
前 : LR” 方 法 ， 或 者 先 将 每 个 协 变量 独 目 选 进 模型 ， 再 将 有 意义 的 协 变量 一 起 选 进 模型 ， 
运用 “进入 ”方法 。 本 例 采 用 “回击 : LR 法 ”。 

2. 分 类 协 变量 定义 : 如 图 18-21 所 示 ， 将 “ 肺 况 类 型 ” 放 入 “分 类 协 变量 ” 框 ， 软 
件 默 认 与 最 后 一 个 类 别 比较 ， 如 果 想 与 第 一 个 类 别 比较 ， 可 以 勺 选 后 面 “ 第 一 个 ” 复 选 
框 后 ， 点 击 “ 变 化 量 ” 按 钮 更 改 。 如 果 分 类 变量 编码 为 1、2、3、4， 你 想 都 与 2 比较 ， 
请 将 2 重 狐 编 色 为 1 或 者 4， 然后 相应 人 设置 即 可 比较 。 


图 18-20 生存 分 析 Cox 回归 图 18-21 定义 协 变量 


3. 图 设置 : 如 图 18-22 所 示 ， 一 般 勾 选 “ 生 存 分 析 ” 即 可 ， 如 果 想 看 风险 函数 图 ， 


义 选 “风险 ” 即 可 。 
置 : 如 图 18-23 所 示 ， 色 选 “Exp (B) 的 置信 区 间 ” 即 可 。 


仔 


「 步 进 概 率 


得 XI : |05 | 际 去 (MM) : 


局 在 每 个 步 台 (E) ar: lz | 
加 在 虹 后 一 个 步 台 册 辐 显示 基线 函 数 旧 ) 


0 


图 18-22 Cox 回归 : 图 设置 图 18-23 ”选项 设置 
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结果 解读 
1. 模型 检验 : 由 图 18-24 可 以 发 现 向 前 LR 法 构建 2 个 有 意义 的 模型 ，P 均 小 于 0.05。 


模型 杀 数 的 Omnibus 检验 


总 体 〔 得 分 】 从 上 一 步 进行 更 改 从 上 一 卖 进行 重 改 
步 长 [T】 -2 对 数 似 然 。 ” 卡 方 ”自由 度 卡 方 ”自由 度 。 显效 尾 。”” 卡 方 ”自由 度 显著 性 
1 386.d404 37.422 1 0.000 34.059 ] 0.000 34.059 1 0.000 
a 372.267 48.765 0.000 14.138 3 0.003 48.197 二 0.000 


a. 在 步 台 与 1: 入院 时 健康 指数 怒 输 入 的 变量 
b. 在 步 天 号 2 肺癌 凿 型 站 和 输入 的 变量 
5. 起 娩 走 号 1 : 方法 = 向 前 步 进 【 疏 然 比 ; 


图 18-24 模型 系数 检验 


2. 方程 中 的 变量 ， 如 图 18-25 所 示 ， 可 以 发 现 第 一 个 方程 包含 入 院 健康 指数 ，HR= 
0.959，HR 可 以 理解 为 COR， 参照 OR 解释 即 可 ， 可 见 入 院 健 康 指数 每 升 高 一 个 级 别 ， 病 
人 死亡 风险 减少 0.049。 第 二 个 方程 包含 入 院 健 康 指数 和 肺癌 类 型 ， 健 康 指数 解释 同上 ， 
肺癌 类 型 解释 如 下 ， 当 是 肺癌 类 型 (1) 不 是 肺癌 类 型 (4) 时， 死亡 风 险 增 大 3.750 倍 ; 
当 是 肺癌 类 型 (2) 不 是 肺癌 类 型 (4) 时， 死亡 风险 增 大 2.268 倍 ; 当 是 肺 瘤 类 型 (3) 
不 是 肺癌 类 型 (4) 时， 死亡 风险 增 大 4.417 倍 。 


方程 中 的 变量 
| 95.0% Exp(B) 的 Cl 
日 SE 瓦尔 他 自由 庶 昆 著 性 Exp(B) 限 上 限 

步骤 1 ”入 院 时 健康 指数 -0.042 0.007 34.387 1 0.946 0.973 
步 邓 2 ”肺癌 类 型 12.173 3 

肺 将 灶 型 (1) 1.322 0.437 9.140 1 1.592 8.835 

晴 闯 类 型 (2) 0.919 0.414 3.911 1 1.007 5.108 

昌 冶 类 型 (3 1.485 0.444 11.172 1 1.849 10.554 

入 院 时 健康 指数 -0.040 0.007 29.020 1 0.947 0.975 


图 18-25 方程 中 的 变量 
3. 生存 函数 曲线 : 当 各 协 变 量 取 均值 时 ， 构 建 的 生存 函数 曲线 如 图 18-26 所 示 。 
按 协 变量 平均 值 的 生存 分 析 函 数 


0 200 400 600 800 ”1000 
生存 时 间 
图 18-26 生存 函数 曲线 
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知识 拓展 

1. Cox 回归 策略 可 以 先进 行 单 因素 分 析 ， 然 后 对 筛选 出 的 有 意义 单 变量 ， 再 进行 多 
因素 分 析 。 如 果 研 究 因 素 皆 为 分 类 变量 ， 则 可 以 采用 Kaplan-Meier 法 进行 单 因素 筛选 ， 
如 果 包 含 连续 性 计量 资料 ， 如 本 例 的 年 龄 ， 可 以 直接 用 Cox 回归 进行 单 因素 第 选 。 

2. 不 同 建 模 策略 ， 肯 定 会 得 到 不 同 的 模型 ， 模 型 一 定 要 结合 专业 进行 解释 。 如 本 例 
采用 的 是 向 前 : LR 法 ， 软 件 会 自动 筛选 有 意义 的 模型 ， 而 我 们 基于 专业 知道 年 龄 和 性 别 
应 该 会 影 啊 治 疗 的 结局 ， 虽 然 上 述 变量 无 统计 学 意义 ， 也 可 以 加 入 模型 ， 采 用 输入 法 进 
行 分 析 ， 图 18-27 为 采用 输入 法 结果 。 


方程 中 的 变量 
95.0% Exp(B) 的 Cl 
B SE 瓦尔 德 自由 度 显著 性 Exp(B) ” ”下限 上 限 

肺 杨 区 型 13.637 3 0.003 
旦 村 六 型 (1) 1.442 0.451 10.075 1 0.002 4.187 1.729 10.136 
师 树 北 型 (2 0.899 0.423 4.505 1 0.034 2.451 1.071 5 634 
肺癌 灶 型 (9) 1.663 0.469 12.554 1 0.000 5 .2715 2.102 13.235 
人 院 时 健 麻 指 星 -0.043 0.006 30.436 1 0.000 0.957 0.943 0.972 
确诊 到 开始 治疗 的 时 间 ( 月 ) -0.003 0.011 0.081 1 0.776 D0.997 0.976 1.019 
年龄 -0.025 0.014 3.355 1 0.067 0.975 0.950 1.002 
性 另 | -0.407 0.386 1.112 1 0.292 0.666 0.313 1.418 


图 18-27 Cox 回归 输入 法 结果 


> 18.5 时 间 依 赖 Cox 回归 


进行 生存 分 析 时 ， 前 提 是 假设 每 个 因素 在 不 同时 间 点 对 结局 的 影响 风险 作用 一 致 ， 
构建 的 模型 成 为 等 比例 风险 模型 。 然 而 很 多 因素 在 不 同时 间 ， 所 发 生 的 作用 发 生变 化 ， 
如 年 龄 变量 ， 年 龄 本 身 随 着 时 间 的 变化 而 变化 ， 同 时 不 同年 龄 人 群 其 发 生 疾 病 的 风险 是 
不 一 样 的 。 因 此 就 需要 特定 的 模型 进行 分 机 ， 束 是 本 节 要 讲解 的 时 间 依 存 变 量 Cox 回归 
模型 。 

案例 实战 

某 研究 者 想 研 究 肺 瘤 的 术 后 生存 时 间 与 手术 时 年 龄 的 关系， 收集 了 一 些 肺 阁 病 例 的 
数据 ， 详 见 18.4.sav 数据 库 。 

实战 步骤 

1. 分 析 一 生存 分 析 一 Cox 依 时 协 变量 ， 如 图 18-28 所 示 ， 将 软件 产生 的 时 间 变 量 
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Timex 年 龄 放 入 “T _ CONV 的 表达 式 (E) ” 框 。 
2. 模型 ， 如 图 18-29 设置 ， 特 殊 之 处 是 不 要 将 年 龄 再 放 入 协 变 量 ， 而 应 该 放 入 “TT_ 
COV ”。 


蛤 cox 回 昌 二 


壤 Tmerrl EE ee rr 
过 于 有 时 间 陨 存 时 间 “| | 和 | mm 2 ey 


坚 石 关 恋 及 存 长 杞 
站 光 性 别 性别 
TT 


图 18-28 ”计算 依 时 协 变量 图 18-29 ”时 间 依 赖 Cox 回归 


3. 结果 解读 : 图 18-30 (A) 为 模型 系数 检验 ，P=0.000， 模 型 有 意义 ; 图 18-30 (B) 
发 现 性 别 无 意义 ， 时 间 依 赖 的 年 龄 (T COV) 有 意义 ， 发 现年 龄 每 增加 一 岁 ， 死 亡 风险 
增 大 1.049 倍 。 


模型 系数 的 Omnibus 检验 ” 


总 体 (得 分 ) 从 上 一 步 进行 更 改 从 上 一 块 进行 更 改 
-2 对 数 似 然 卡 方 目 由 度 显 着 性 卡 方 目 由 度 显 者 性 卡 方 目 由 度 显 者 性 
106.854 70.478 2 0.000 。 233.228 2 0.000 233.228 2 0.000 


a. 起 始 块 导 1 : 方法 = 输入 


方程 中 的 变量 
95.0 和 % Exp(B) 的 CI 
B SE 瓦尔 礼 自由 度 显 着 性 Exp(B) 下 限 上 限 
T_GOV_ 0.047 0.008 398.165 1 0.000 1.049 1.033 1.064 
性 别 | 0.657 0.454 2.093 1 0.148 1.929 0.792 4.699 


图 18-30 ”时 间 依 赖 Cox 结果 


2 > ; 
> 第 19 曹 紧 类 与 判别 分 析 


“ 物 以 类 聚 ， 人 以 群 分 ”， 这 人 句 话 可 以 非常 形象 地 解释 聚 类 和 判别 分 析 。 聚 类 分 析 
是 基于 数据 之 间 的 距离 远近 ,对 研究 变量 进行 聚 类 分 组 ,， 聚 类 分 析 事 先 不 知道 分 组 情况 ， 
是 一 种 探索 性 分 析 ; 判别 分 析 事 先 给 我 们 几 个 分 好 类 的 组 ， 然 后 让 我 们 基于 现 有 分 组 数 
据 的 特征 ， 构 建 分 组 的 方程 ， 即 判别 式 ， 然 后 依据 判别 式 对 未 知 的 样本 进行 分 类 判别 。 
聚 类 分 析 就 是 分 析 如 何 对 样品 (或 变量 ) 进行 量化 分 类 的 问题 。 通 常 聚 类 分 析 分 为 
O 型 聚 类 和 R 型 聚 类 。O 型 聚 类 是 对 样品 进行 分 类 处 理 ，R 型 聚 类 是 对 变量 进行 分 类 处 
理 。 聚 类 常见 类 型 有 系统 聚 类 、K-means 聚 类 和 两 步 聚 类 ， 判 别 分 析 和 常见 有 Fisher 判别 
和 Bayes 判别 。 


> 19.1 系统 聚 类 


19.1.1 简介 


系统 聚 类 是 实际 工作 中 ， 最 和 常 使 用 的 一 种 聚 类 方法 ， 它 的 特点 为 不 仅 可 以 对 变量 聚 
类 (R 聚 类 ) ， 还 可 以 对 样品 进行 聚 类 (QO 聚 类 ) ， 还 可 以 同时 指定 多 个 聚 类 进行 尝试 
性 的 聚 类 。 

19.1.2 基本 思想 

先 将 n 个 样品 或 变量 看 成 n 个 分 类 ， 然 后 将 距离 接近 (样品 聚 类 ) 或 性 质 接 近 〈 变 
量 聚 类 ) 的 两 类 合并 为 一 类 , 再 从 nn-1 类 中 继续 寻找 最 接近 的 两 类 合并 为 一 类 , 如 此 继续 ， 
最 终 将 所 有 类 别 合 并 为 一 文 。 

19.1.3 ”案例 实战 

西藏 林芝 某 目 然 村 20 位 村 民 一 起 上 山 采 集 冬虫夏草 ， 采 集 完 毕 即将 回 村 出 售 虫草 的 
前 一 夜 ， 价 值 数 十 万 的 虫草 不 强 而 飞 。 和 警方 介入 调查 ， 欧 山野 岭 排 除外 盗 ， 怀 疑 20 名 村 
民 内 盗 ， 但 初步 审问 案情 室 无 进展 。 警 方 接受 某 大 学 统计 老师 建议 ， 将 20 名 村 民 的 鞋子 
脱 下 密封 采样 ， 带 回 实验 室 进 行 检 测 ， 数 据 见 data17.1.sav。 
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19.1.4 ”案例 解析 

为 了 让 统计 学 习 起 来 有 意思 ， 本 例 为 虚构 案 侈 
位 村 民 ， 如 果 发 生 监 守 自 盗 的 话 ， 理 论 上 那个 偷 虫草 的 小 偷 应 该 是 夜里 自己 偷 出 去 藏 好 ， 然 
后 天 亮 前 赶 回 营 地 ， 那 么 该 小 偷 鞋 底 的 泥土 的 新 鲜 程 度 及 一 些 土壤 特征 将 与 其 他 19 位 村 民 
不 一 样 。 因 此 我 们 可 以 答 试 对 20 份 土壤 进行 聚 闫 ， 看 能 合 根 据 泥 土 特征 将 小 偷 识别 出 来 。 


19.1.5 ”实战 步 又 


但 不 妨 伺 我 们 学 习 聚 类 知识 。 本 例 20 


EE ~ 
案 类 
pe 各 


图 19-1 系统 聚 类 分 析 


(2) 统计 设置 ， 点击“ 统计 ”， 弹 出 图 19-2， 聚 类 成 员 本 例 选择 “单个 解 ”， 输 入 
2。 因 为 根据 本 例 的 研究 目的 ， 分 成 两 类 ， 即 小 偷 与 非 小 偷 。 绝 大 多 数 情况 我 们 是 不 知道 
应 该 聚 成 几 类 ， 那 就 选择 解 的 范围 ， 一 般 输入 3 ~ 5 类 ， 让 软件 进行 聚 类 ， 并 结合 专业 
进行 解释 。 

(3) 图 设置 ; 点 击 图 按钮 ， 如 图 19-3 所 示 ， 勾 选 “谱系 图 ”， 此 图 可 以 做 出 树 状 结构 
图 ， 只 有 系统 聚 类 可 以 做 。 冰 柱 图 保持 默认 的 全 部 聚 类 。 冰 柱 图 是 用 类 似 冰 柱 的 条 图 反 
映 聚 类 构成 ， 近 年 用 得 较 少 ， 没 谱系 图 应 用 广 。 方 向 是 指 做 谱系 图 的 方向 。 

(4) 方法 : 点 击 方法 ， 如 图 19-4 所 示 ， 组 间 链 接 较为 常用 ， 是 一 种 优秀 而 稳健 的 方 
法 ， 在 大 多 数 情况 下 表现 最 为 优异 ， 本 例 保持 默认 。 从 本 图 可 以 看 出 ， 系 统 聚 类 适用 的 
指标 类 型 包括 区 间 性 的 连续 资料 〈 计 量 资料 、 数 值 变量 ) ， 计 数 资料 及 二 分 类 资料 。 


292 | SPSS 实战 与 统计 思维 | 


集中 计划 (A) 
近似 值 捷 阵 (P) 


图 全 部 杜 类 (A) 

回 指定 范围 内 的 遇 类 (8) 
开始 遇 类 (T) : |1 
停止 亚 类 (P): | 


依据 但 ) : 1 


外 无 (N) 


图 19-2 ”统计 设置 


标 保存 在 数据 库 中 ， 而 不 是 仅仅 在 结果 输出 中 。 本 例 因 为 根据 研究 目的 聚 成 2 类 ， 因 此 
选择 单个 解 ， 输 入 数目 2。 回 到 主 对 话 框 ， 点 击 “ 确 定 ” 运 行 。 


加 区间 (N): 欧 氏 距 高 
大 0) : 


车 计数 (T) : ”| 卡 方 测量 Ey 
元): | 平 廊 区 FE 高 "| 


存在 IP): |1 ”| 不 存在 由 : 0 | 


转 的 慎 转换 测量 
ete: i | Ome 
态 控 变 有 量 (V) 更 改 社 写 (H) 
加 按 沾 案 (C) : 重新 标 度 到 | Q-11 范围 (E) 


图 19-4 距离 计算 方法 设置 图 19-5 保存 设置 


19.1.6 ”结果 解读 


(1) 集中 计划 ， 如 图 19-6 所 示 ， 该 结果 用 于 反映 样本 聚 类 的 过 程 ， 以 图 中 前 2 条 
为 例 进行 解释 ， 第 一 阶段 是 样品 2 和 样品 6 聚 成 一 文 ， 然后 第 二 阶段 ， 这 一 文 义 和 样品 
19 进行 聚 尖 。 访 图 仅 为 聚 闫 过程 展示 ， 可 以 不 看 。 

(2) 聚 类 成 员 ， 图 19-7 告诉 我 们 按照 2 类 的 聚 类 要 求 ， 软 件 按照 系统 聚 类 的 方法 ， 
给 出 的 最 终 聚 类 结果 。 结 果 发 现 样 品 16 自 成 一 类 。 其 他 19 份 样品 聚 成 一 类 。 言 下 之 意 ， 
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16 号 样品 所 代表 的 那个 人 ， 是 本 次 作案 的 重要 嫌疑 人 。 于 是 警方 根据 聚 类 结果 ， 对 16 
号 样品 所 来 和 目的 人 进行 了 重 扣 审问 ， 该 人 最 终 承认 目 己 内 盗 的 事实 ， 并 市 着 警方 找到 失 
饥 的 虫草 。 


集中 计划 情 业 成 员 
组 合 聚 类 首次 出 现 聚 类 的 阶段 过 “个 学 区 
ED 农业 1 家 类 2 下 二 7 家 类 1 聚 类 2 一 个 阶段 1 1 
EE 3 0 0 2 2 1 
2 2 .69| 1 0 8 3 1 
3 8 9 3.000 0 0 12 4 1 
4 7 18 4.640 0 0 5 1 
5 3 5 5.870 0 0 14 5 1 
6 12 20 6.180 0 0 10 7 1 
7 15 17 8.090 0 0 11 8 1 
8 2 7 13.100 2 4 13 9 1 
9 10 11 15.900 0 0 15 10 1 
10 12 14 25.510 6 0 14 11 1 
11 13 15 25.535 0 7 15 12 1 
12 4 8 32.320 0 3 17 13 1 
13 1 2 37.759 0 8 18 14 1 
14 3 12 50.695 5 10 16 15 1 
15 10 13 55.200 9 11 16 
16 3 10 151.141 14 15 17 17 1 
17 3 4 440.397 16 12 18 18 1 
18 1 3 842.679 13 17 19 19 1 
19 1 16 1181.806 18 0 0 20 1 
图 19-6 聚 类 计划 图 19-7 聚 类 成 员 


(3) 冰 柱 图 :; 冰 柱 图 也 是 聚 类 结 采 的 展示 方式 ， 但 很 多 人 不 会 判读 。 以 图 中 所 做 的 
横 线 为 例 ， 横 线 对 应 的 聚 类 数目 为 5， 我 们 从 5 类 处 画 一 条 横 线 ， 该 横 线 将 20 份 样品 划 
分 为 5 个 部 分 ， 见 图 19-8 中 标示 。 冰 柱 图 已 经 较 少 应 用 。 


个 案 
ji I TIPPETT TT 


图 19-8” 冰 柱 图 
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(4) 谱系 图 : 如 图 19-9 所 示 ， 该 图 更 加 形象 地 展示 聚 类 的 结果 ， 根 据 本 例 研究 目 
的 聚 成 2 类， 发现 16 号 样品 自 成 一 支 。 


使 用 平均 联接 (组 间 ) 的 谱系 图 
重新 标 度 的 距离 聚 类 组 合 
0 5 10 15 20 25 


图 19-9 谱系 图 


(5) 数据 库 : 此 时 大 家 回 到 数据 库 ， 会 发 现 数据 库 最 右边 产生 一 个 新 的 聚 类 变量 ， 
该 变量 展示 的 就 是 图 19-7 的 结果 。 


19.1.7 拓展 理解 


(1) 系统 聚 类 既 可 以 进行 样品 聚 类 ， 也 可 以 进行 变量 聚 类 。 

(2) 系统 聚 类 可 以 进行 答 试 聚 类 ， 即 输入 如 3 一 5， 既 可 以 同时 展示 聚 类 成 3 类 、 
4 类 和 5 类 的 结果 。 这 是 我 们 经 常 的 操作 ， 因 为 很 多 的 时 候 ， 我 们 并 不 知道 要 吧 成 几 类 。 

(3) 系统 聚 类 可 以 做 冰 柱 图 和 谱系 图 ， 谱 系 图 比较 重要 。 

(4) 到 感应 该 聚 成 几 类 呢 ? 

( 聚 类 结果 一 般 要 求 各 聚 类 组 成 员 数 目 相 差 不 大 ， 除 非 目 的 是 异常 值 的 发 现 ， 比 如 
本 例 。 

凶 如 果 规 律 是 存在 的 ， 那 么 不 同方 法 应 该 得 到 相似 或 一 致 的 结果 ， 意 即 可 用 不 同 聚 
类 方法 对 数据 进行 聚 类 。 
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@ 拆 分 验证 : 如 果 数 据 样 本 量 较 大 ， 则 可 以 将 数据 随机 分 为 两 个 部 分 ， 对 两 部 分 分 
别 进行 聚 类 。 因 为 数据 为 来 目 同一 总 体 的 2 个 部 分 ， 因 此 有 聚 类 得 到 的 结果 应 该 一 致 。 

由 采用 两 步 聚 类 ,看 看 结果 。 两 步 聚 类 为 智能 聚 类 ， 软 件 会 评价 聚 成 几 类 较为 合适 。 

加 主 成 分 分 析 提 供 参考 ， 对 于 变量 聚 类 ， 可 以 采用 主 成 分 分 析 ， 看 可 以 凝练 成 几 个 
主 成 分 ， 则 建议 变量 聚 类 成 相应 的 几 类 。 

理想 的 聚 类 ， 首 先 应 该 稳定 ， 并且 专业 上 很 好 解释 。 同 时 在 聚 类 图 上 ， 有 一 个 特点 ， 
就 是 组 间 的 差异 很 大 ， 而 组 内 的 差异 较 小 。 


> 19.2 快速 聚 类 


19.2.1 人 简介 


该 方法 只 是 用 样品 聚 类 ， 还 必须 指定 聚 类 的 数目 ， 并 且 所 有 的 指标 必须 为 连续 性 的 计量 
资料 。 

19.2.2 ”基本 思想 

对 n 个 数值 变量 参与 快速 聚 类 ， 则 nn 个 变量 组 成 一 个 nn 维 的 空间 ， 每 个 样品 是 空间 
中 的 一 个 点 ， 最 终 按照 事先 要 求 聚 类 聚 成 下 个 类 别 。 聚 类 前 计算 机 随机 产生 初始 的 聚 类 
中 心 ， 计 算 各 个 点 到 中 心 的 距离 ， 然 后 计算 机 迭代 新 的 聚 类 中 心 。 如 果 各 个 点 到 第 二 次 
聚 类 中 心 的 距离 比 第 一 次 小 ， 则 放弃 第 一 次 中 心 ， 留 取 第 二 次 中 心 。 接 着 计算 机 继续 迭 
代 寻 找 第 三 次 聚 类 中 心 ， 直 至 各 个 点 到 前 后 聚 类 中 心 的 距离 之 差 为 零 ， 此 时 认为 已 经 无 
法 再 进一步 优化 ， 即 找到 最 佳 的 聚 类 中 心 。 

19.2.3 ” 穴 例 实战 

某 研究 者 搜集 了 某 年 我 国 31 个 省 份 自治 区 的 第 一 产业 、 第 二 产业 、 第 三 产业 的 产值 ， 
数据 见 data19.2.sav， 请 根据 数据 对 我 国 31 个 省 份 自治 区 按照 经 济 状况 进行 聚 类 分 析 。 

19.2.4 案例 解析 


本 例 31 个 省 份 ， 每 个 省 份 有 3 个 经 济 指标 ， 均 为 连续 性 资料 。 题 目 要 求 对 31 个 省 
份 进行 诊 类 ， 属 于 样品 聚 类 ; 另 根据 专业 ， 我 们 喜欢 按照 经 济 状况 分 为 发 达 地 区 、 中 等 


296 | SPSS 实战 与 统计 思维 | 


发 达 地 区 和 从 友 达 地 区 3 类 。 本 例 可 以 采用 系统 聚 类 入 -means 聚 类 , 此 处 尘 示 快速 肾 类 。 
19.2.5 ”案例 实战 


(1) 打开 数据 ， 分 析 一 分 类 一 均值 聚 类 ， 如 图 19-10 所 示 ， 将 三 个 产值 “变量 ” 
放 入 “变量 ” 框 ， 将 地 区 变量 设置 为 “个 案 标注 依据 ”， 设 置 后 聚 类 信息 显示 的 就 直接 
为 地 区 ， 人 否则 为 系统 给 出 的 ID; 聚 类 数 根 据 研究 目的 按 专 业 设 定 为 3 类 ; 

(2) 迭代 设置 点击“ 过 代 ”， 如 图 19-11 所 示 ， 系 统 默 认 最 大 友 代 次 数 为 10， 收 
敛 标准 为 0。 意 即 软件 最 多 做 10 次 寻找 最 佳 聚 类 中 心 ， 如 果 10 次 还 未 找到 则 停止 寻找 ， 
但 软件 一 般 10 次 之 内 都 会 找到 。 收 敛 条 件 为 0， 即 前 后 2 次 如 果 各 点 到 聚 类 中 心 的 距离 
之 状 为 0， 则 达到 收敛 标准 ， 意 即 已 经 找到 最 佳 聚 类 中 心 ， 可 以 进行 聚 类 了 。 


| -si - 
回 诗 乳 初 二 异类 中 心 -EY 日 EF 
加 打开 于 I 上 信 (NI) daiajd28.5ay 代 kr 操 储 3] | Ea : 
、 展 志 迁 信 次数 [MM) : 
国外 部 疗 眶 文件 [及 证 加 | 
| | 回 号 式 好 经 惑 寺 中心 Wi) : 收效 条 件 愉 ] : po | 
区 新 独 拒 茶 癌 ) 


加 使 用 运行 平均 值 册 ) 
国 滁 据 交 件 (8) EE 


图 19-10 下 均值 聚 类 图 19-11 过 代 设置 


(3) 保存 设置 : 如 图 19-12 所 示 ， 义 选 “ 聚 类 成 员 ” 和 “与 聚 类 中 心 的 距离 ”， 
后 点 击 “ 继 续 ”， nb 
(4) 选项 设 置 : 加 图 ]19-131 设置 Ee 


图 19-12 保存 设置 图 19-13 ”选项 设置 
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19.2.6 ”结果 解读 

(1) 初始 中 心 与 迭代 记录 ， 如 图 19-14 所 示 ， 初 始 中心 为 计算 机 随机 产生 ， 对 结果 
判读 意义 不 大 ; 迭代 记录 显示 结果 3 次 迭代 ，3 个 聚 类 中 心 均 达到 收敛 标准 0， 于 是 3 次 
就 停止 了 对 最 佳 聚 类 中 心 的 寻找 ， 因 为 已 经 找到 。 


初始 到 类 中 心 
聚 业 
1 2 3 
1093.92 40.62 90.64 
17307.08 47.99 3130.72 
5225.21 95.89 3029.45 
选 代 历史 记录 ” 
聚 类 中 心中 的 变动 
选 代 < 
1 670.059 981.691 1065.650 
2 564.377 0.000 240.221 
3 0.UUU U.UV0 U.0UU 


3. 由 于 束 类 中 心中 不 存在 变动 或 者 公有 
小 己 变 动 ， 因 此 实现 了 收效 * 任何 中 
心 的 最 大 绝对 坐标 变动 为 0.000 。 当 
前 小 代为 3。 初始 中 心 之 间 的 最 小 距 
离 为 4255.761 。 


图 19-14 初始 中 心 与 迭代 记录 


(2) 聚 类 成 员 : 图 19-15 中 显示 各 个 地 区 及 其 聚 类 的 类 别 ， 同 时 显示 各 地 区 到 各 自 
聚 类 中 心 的 距离 。 如 北京 属于 3 类 地 区 ， 北 京 到 3 类 聚 类 中 心 的 距离 为 1385.724， 其 他 
解释 类 似 。 你 可 能 会 纳 问 ， 首 都 北京 怎么 会 属于 3 类 地 区 呢 ， 注 意 ， 此 处 1、2、3 类 仅 
是 类 别 区 分 ， 并 代表 哪 一 类 较 好 或 者 较 差 。 

(3) 最 终 聚 类 中 心 与 相互 间 聚 类 ， 如 图 19-16 所 示 ， 最 终 聚 类 中 心 结 果 较 为 重要 ， 
图 中 可 见 1 类 聚 类 中 心 在 3 产 产 值 上 均 最 大 ， 因 此 1 类 为 友 达 地 区 ， 同 样 可 见 3 类 为 中 
等 发 达 地 区 ，2 类 为 欠 发 达 地 区 。 

(4) ANOVA 表 : 图 19-17 对 三 个 产业 均 进 行 了 方差 分 析 ，3 次 检验 的 P<0.05， 说 
明 三 个 产业 在 3 个 聚 类 间 均 存在 统计 学 差异 ， 说 明 三 个 产业 对 聚 类 结果 均 发 挥 作 用 。 如 
果 某 个 P>0.05， 说 明 其 对 聚 类 结果 无 影响 ,删除 也 并 不 影响 聚 类 结果 。 

(5) 聚 类 个 案 数 目 : 由 图 19-18 可 知 1 类 地 区 (发 达 地 区 ) 有 4 个 ; 3 类 (中 等 发 达 地 
区 ) 有 11 个; 2 类 地 区 〈 欠 发 达 地 区 ) 有 16 个。 具体 聚 类 参见 图 19-15。 
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= 
JI 
竺 
[X| 
漳 
将 
必 
了 


1385.724 
0063.342 
1193.462 
626.991 
220.032 
317.300 
448.393 
7136.679 


= 
: 


1245.932 


ER 
: 


me 
车 
江 


381.287 
1693.132 
1012.800 

94.867 

021.919 
471.444 
1143.947 

130.039 

1788.131 
1173.076 

370.067 

7161.7199 

321.273 

304.130 
291.36]1 


| | 
由 
姓 


= 
已 
于 


E 


16 
17 
18 
19 
20 
21 
2 
23 


M2 | ty 

> 
Hl| 潍 
天 | 主 


401.637 
981.691 
433.741 
292.899 
840.178 
843.426 
103.432 


ex 
于 
寺 


to 
中 
天 


二 
未 


一 
二 
曾 


进 
EE 


图 19-15 ” 聚 类 成 员 
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最 终 褒 匡 中 心 
家 类 
1 2 3 


第 一 产业 1102.14 307.62 713.28 
溃 二 产业 “6423.01 195.41 2545.20 
第 三 产业 4454.26 673.63 2122.87 


Be 最 终 译 类 中 心 之 间 的 距离 


字 小 1 3 3 
1 B825.998 4541.363 
2 B925.998 2307.946 
3 4541.363 2307.946 
图 19-16 
well 每 个 说 类 中 的 个 案 数 目 
聚 类 误 关 en 
Bl 有 AF HR FF Br 0 ee 
第 一 产业  1226085.648 2 “80836.239 29 15168 0 000 2 16.000 
第 二 产业 InA594.77 2 44139498.369 28 125.751 0.000 3 11.000 
第 三 产业 。 24573697.76 2 “183220.565 28 134.121 0.000 有 效 31 000 
由 于 已 选择 京 类 以 使 不同 罕 贡 中 个 案 之 辣 的 董 异 最 大 化 ， 因 此 上 检验 只 应 该 用 于 指 过 目 半 于 人 
测 显 著 性 水 平 并 来 因此 进行 修正 ， 所 以 无 法 解释 为 针对 " 富 类 平均 值 相等 "这 一 假设 的 检验 。 LS 
19-17 ANOVA 结果 17-18 “ 聚 类 个 案 数 目 
19.2.7 拓 技 


快速 聚 类 只 适用 于 变量 聚 类 ， 如 果 想 利用 快速 聚 类 进行 样品 聚 类 ， 可 以 对 数据 库 进 
行 行列 转 置 ， 然 后 对 转 置 后 的 数据 进行 快速 聚 类 ， 也 就 相当 于 是 样品 聚 类 了 。 人 快速 聚 类 
不 能 够 做 出 相应 的 聚 类 图 ， 这 是 一 个 缺憾 。 


3 19.3 两 步 聚 类 


19.3.1 人 简介 

两 步 聚 类 于 1996 年 提出 ， 是 一 种 智能 的 聚 类 方法 ， 其 聚 类 变量 既 可 以 是 连续 性 的 计 
量 资料 ， 也 可 以 是 离散 性 的 计数 资料 ， 并 且 自 动 进行 聚 类 的 类 别 数 确定 ， 结 果 也 更 为 稳 
定 可 靠 。 


-A 


利用 统计 量 作为 距离 进行 聚 类 ， 两 步 聚 类 顾名思义 分 为 两 步 ， 先 进行 预 聚 类 ， 然 后 


19.3.2 
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在 预 聚 类 基础 上 ， 根 据 AIC 和 BIC 最 小 原则 ， 目 动 判定 聚 关 数目 。 两 步 和 


但 软件 实现 起 于 Ne 复杂 。 
19.3.3 ”案例 实战 
笔者 调查 了 某 高 校 590 名 大 学 生 ， 测 得 性 血型 、 身 高 、 体 重 、 肺 呼 量 、 胸 围 、 
年 龄 和 体育 成 绩 指 标 ， 数 据 见 data19.3.sav。 请 读者 选用 合适 的 方法 进行 聚 类 并 解释 结果 
19.3.4 ”案例 解析 


本 例 研究 样本 量 590 人 , 研究 指标 包括 分 类 变量 ( 
本 午 、 肺 呼 量 、 胸 围 、 年 龄 和 体育 成 绩 ) ， 因 为 包含 2 种 变量 类 型 ， 
讲述 的 聚 关 方法 ， 本 例 采 用 两 步 聚 关 法 。 


19.3.5 ”案例 实战 


(1) 打开 数据 ， 分 析 一 分 类 一 两 步 聚 类 ， 如 图 19-19 所 示 ， 将 分 类 变量 性 别 与 血型 
I 框 中 ， Es “连续 变量 ， 框 中 。 
十 : 交 性 变量 进 和 dd UE 


生 别 、 血 型 ， 和 连续 性 变量 (里 高 、 
习 此 不 再 使 用 表面 


也 
er 


I i a era 
作 浊 惠 | 岗 过 特 吕 未 在 异型 二 看 吕 中 。 
变量 他 ] : 评 佑 宇 技 正 ) ， 


| 辆 :站 区 类 成 辣 变 县 
交 ML 交 件 
- 届 关 地 目 - 恒 闪 壮 出 回 导出 最 挫 模 型 仿 ) 
是 谭 品 莹 用 叶 斯 装 串 避 I) 名 称 E】: 
吕 天 但 0 : 全 赤 池 信息 准则 钨 C1 
名 指 生 加 证 首 上 E) 
数 填 出) : : = 


回 导 出 CF 树 00 
名 称 售 1: 


图 19-19 ”二 阶段 聚 类 


19.3.6 ”结果 解读 
(1) 模型 概要 ,如 图 19-21 所 示 ， 采 用 两 步 际 
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下 面 为 聚 类 模型 评价 尺度 图 ， 发 现 聚 类 效果 民 好 。 注 意 : 本 例 图 中 SPSS24 有 BUG， 显 
示 两 个 展 好 ， 最 右边 应 为 优秀 。 双 击 该 图 ， 可 以 弹出 模型 得 看 左 ， 如 图 19-22 所 示 。 


小 隧 和 分 离 的 轮 廉 测量 
图 19-21 模型 概要 


(2) 模型 查看 器 ， 点 击 左下 角 下 拉 菜 单 ， 选 择 “ 聚 类 ”， 图 19-22 显示 最 终 聚 成 的 
2 类 中 ， 各 个 指标 的 分 布 ， 分 布 差异 越 大 ， 说 明 该 指标 的 重要 性 越 高 。 
最 类 


输入 【预测 变量 ) 重要 性 
国 1.0 加 0.8 贺 0.6 加 0.4 国 0.2 口 00 


图 19-22 ”变量 聚 类 可 视 化 
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点 击 下 拉 菜 单 ， 勾 选 “ 预 测 变量 重要 性 ”， 如 图 19-23 所 示 ， 该 图 可 以 告诉 我 们 在 
输入 的 8 个 自 变量 中 ， 对 于 最 终 建立 的 2 个 聚 类 ， 按 变量 的 重要 性 大 小 排序 ， 结 果 可 见 ， 
性 别 > 肺 呼 量 > 喘 高 > 体重 > 胸围 > 年 龄 > 体育 成 绩 > 血型 。 前 3 个 变量 重要 性 大 于 
60% 以 上 ， 其 他 均 较 小 。 

对 于 这 点 ， 根 据 各 自 不 同 的 专业 ， 应 该 有 不 同 的 启示 ， 本 例 是 否 可 以 考虑 将 较 小 的 
删除 ， 本 例 笔 者 仅 保 留 性 别 、 身 高 与 体重 ， 再 次 进行 两 步 聚 类 ， 得 到 图 19-24， 发 现 输入 


变量 3 个 ， 聚 成 2 类 ， 模 型 质量 已 经 优秀 了 ， 比 前 面 8 个 变量 的 模型 还 要 好 。 注 意 : 本 
例 图 中 SPSS 24.0 有 BUG， 显 示 两 个 良好， 最 右边 应 为 优秀 。 


玉 U 测 变量 于 要 性 


模型 概要 


聚 类 质量 


rr a -10 -0.5 0.0 0.5 1.0 


ET ss 凝 窜 和 分 离 的 轮廓 测量 
图 19-23 ”预测 变量 重要 性 图 19-24 ”模型 概要 


上 面 8 个 指标 建立 的 聚 类 结果 还 没有 3 个 指标 优秀 , 似乎 建议 选择 3 个 指标 就 可 以 了 ， 
本 例 其 他 几 个 指标 检测 也 不 算 复 杂 ， 如 果 是 一 些 需要 较 多 时 间 、 费 时 费力 的 指标 ， 我 们 
删除 后 ， 确 实 可 以 节约 很 多 的 精力 。 


19.3.7 ”拓展 理解 


本 章 讲 解 的 聚 类 分 析 ， 都 是 一 种 探索 性 分 析 ， 聚 类 分 析 是 没有 模型 方程 的 ， 系 统 聚 
类 适用 小 样本 ;快速 聚 类 适用 于 大 样本 ; 两 步 聚 类 适用 于 既 包 含 连续 又 包含 分 类 变量 的 
数据 ， 并 且 可 以 对 变量 的 重要 性 进行 预测 。 
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> 19.4 Fisher 判别 与 Bayes 判别 


19.4.1 简介 


判别 分 析 就 是 依据 现 有 的 数据 分 类 标准 ， 识 别 并 建立 判别 函数 ， 并 运用 该 判别 函数 
去 分 类 新 的 数据 。 比 如 医生 根据 胰腺 炎 的 不 同类 型 建立 判别 函数 ， 就 可 以 在 病人 入 院 时 
快速 地 判定 其 为 何 种 类 型 ， 进 而 采取 适宜 的 处 理 措施 . 


19.4.2 ”基本 思想 


Fisher 判别 ， 又 称 典 型 判别 ， 其 基本 思想 为 利用 投影 ， 将 原来 在 及 维 空间 的 目 变 量 
组 合 投影 到 较 低 的 S 维 空间 ， 然 后 在 S 维 空间 再 分 类 。 投 影 原则 为 同类 离 差 尽量 小 ， 不 
同类 离 差 尽 可 能 大 。 

Bayes 判别 : 该 判别 方法 认为 所 有 PP 个 类 别 都 是 空间 中 互 斥 的 子 域 ， 每 个 观测 对 象 
部 是 空间 中 的 一 个 点 。 他 首先 计算 东 个 观测 对 象 的 先 验 概率 ， 然 后 利用 Bayes 公式 按照 
一 定 准 则 构造 一 个 判别 函数 ， 分 别 计算 该 样品 落 入 各 个 子 域 的 概率 ， 所 有 概率 中 最 大 的 
一 类 就 被 认为 是 该 观测 对 象 所 属 的 类 列 。 


19.4.3” 守 例 实战 

为 了 明确 诊断 出 小 儿 肺 炎 三 种 类 型 ， 某 研究 者 测 得 30 名 结核 性 肺炎 、22 名 化 脓 性 
肺炎 和 28 名 细菌 性 肺炎 共 80 名 患 儿 的 7 项 生理 、 生 化 指标 ， 见 data19.4.sav， 试 建立 判 
别 函 数 。 

19.4.4 ”案例 解 

本 例 数 据 已 经 事先 知道 包括 30 名 结核 性 肺炎 、22 名 化 脓 性 肺炎 和 28 名 细菌 性 肺炎 
的 7 项 指标 ， 分 类 已 经 明确 ， 现 尝试 让 软件 根据 数据 间 的 关系 ， 建 立 线 性 判别 模型 。 

19.4.5 ”案例 实战 


(1) 打开 数据 ， 分 析 一 分 类 一 判别 分 析 ， 如 图 19-25 所 示 ， 将 group 放 入 分 组 变量 ; 
Xi-X7; 放 入 目 变 量 ; 勾 选 “使 用 步 进 法 ”。 
(2) 统计 设置 : 如 图 19-26 所 示 ， 选 择 “ 费 希 尔 ” 和 “未 标准 化 ”， 注 意 ， 这 里 的 
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费 希 尔 为 Bayes 判别 ， 未 标准 化 为 Fisher 判别 。 


而 I 分 析 x 


分 组 赤 量 忆 ) : 


如 TOURE 3) 


图 19-25 “判别 分 析 ”图 19-26 统计 设置 
(3) 分 类 设置 ， 如 图 19-27 所 示 勾 选 即 可 ，Bayes 判别 会 考虑 先 验 概率 ， 如 果 不 指 


定 即 假定 所 有 组 相 每， 也 可 以 让 软件 根据 组 的 大 小 计算 ， 后 续 目 行 和 尝试 两 种 算法 。 
(4) 保存 设置 义 选 “预测 组 成 员 ”“ 判 别 得 分 ”和 “组 成 员 概 率 ”。 


佑 用 协 方差 汇 阵 

加 组 内 (W 

加 性 组 P) 

图 昌吉 SF: 医 可 


个 案 半 有 果 人 下) 合并 组 介 ) 


国 将 个 案 限 制 条 前 (L) : 分 组 他 ) 
摘要 表 (U) 领域 图 上 T) 
留 一 分 类 (WV) 


| 国志 别 得 分 (D) 
图 组 成 员 概率 低 ) 


将 缺失 值 蔡 换 为 平均 值 蚜 ) 


图 19-27 分 类 图 19-28 “判别 分 析 保存 设置 


19.4.6 主要 结果 解读 


(1) 步 进 统 计 结 果 ， 如 图 19-29 所 示 ， 结 果 显 示 马 、 总 被 排除 ， 留 下 闷 、 瑟 、 扎 、 
和 和 成 ， 书 均 小 于 0.05。 

(2) 典型 判别 函数 摘要 ， 图 19-30 中 可 见 建立 了 2 个 典型 判别 函数 ， 第 一 个 函数 
可 以 解释 总 变异 的 70.8%， 第 二 个 可 以 解释 总 变异 的 29.2%。 两 个 判别 函数 均 有 意义 ， 
P=0.000<0.05。 
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步 进 统计 上 典 则 判别 消 数 摘要 
输 区 除去 的 变量 3 中 
成 夸克 Lambda pp 
稍 硼 F . 

中 驯 输入 统计 自由 庶 1 ”自由 度 2 ”和 白 由 度 3 统计 自由 讼 1 ” 自由 度 ? 
1 x1 0.515 1 2 77.000 36.217 2 77.000 2 
2 #5 0.356 2 2 77.000 25.691 4 152.000 a. 存 分 析 中 使 用 了 前 2 个 典 则 判别 隙 数 。 
3 x6 0.276 3 2 77.000 22.580 6 150.000 
4 x3 0.221 4 2 77.000 20.888 8 148.000 
5 x7 0.190 5 2 77.000 18.872 10 -146.000 不 未 克 Lambda 
在 每 个 步骤 中 ， 将 输入 可 以 使 总 体 威 尔 克 Lambda 最 小 化 的 变量 < 威 尔 克 

a. 最 大 步 时 数 为 14 * 本 数 桩 驴 Lambda 方 

b. 要 和 输入 的 最 小 二 F 为 3.84 。 1 直至 3 0.190 124.4532 

5 要 际 去 的 最 太 侦 FF 为 2 站 2 0.557 43.857 

d.F 级 别 ， 容 着 或 VIN 不足 ' 无 法 进行 进一步 计算 。 

图 19-29 ” 步 进 统计 结果 图 19-30 ”典型 判别 函数 摘要 


(3) 标准 化 典型 判别 函数 ， 根 据 图 19-31 可 以 据 此 写 出 标准 化 典型 判别 函数 方程 : 
D,=1.109xZX+0.522xZX%,+0.056xZX.+0.560xZX.—0.401xZX, 
D,=0.146xZX+0.408xZX,+0.828xZX,-0.376xZX.-0.343xZX 
标准 化 典型 判别 函数 应 用 时 需要 将 原始 变量 进行 标准 化 ， 使 用 起 来 不 太 方便 ， 因 此 

常用 未 标准 化 典型 判别 函数 。 

(4) 未 标准 化 典型 判别 函数 ， 根 据 图 19-32 可 以 写 出 未 标准 化 判别 函数 。 
D,=—2.461+0.034xx,+0.717xx,+0.098xx.+0.024xx。0.046xx, 
D,=—0.326xx,+0.005xxs+1.461xx,—0.016xx.-0.040xx; 

未 标准 化 典型 判别 函数 的 应 用 是 将 患者 5 项 x 指标 分 别 代 入 方程 , 得 到 D, 和 DD, 得 分 ， 
然后 根据 得 分 ， 在 区 域 图 中 ， 确 定 该 患者 的 分 类 。 即 未 标准 化 典型 判别 函数 需要 结合 区 
域 图 进行 结果 解释 。 


标准 化 典型 判别 函数 系数 典型 判别 函数 系数 
图 tty : EE ; 
一 

x] 1.109 0.146 x3 0.717 0.561 

x3 0.522 0.408 X9 0.098 1.461 

x5 0.056 0.828 x6 0.024 -0.016 
xr -0.046 -0.040 

x6 0.560 -0.376 


(常量 ) -2.461 -0.326 
X7 -0.401 -0.343 标准 化 系数 


图 19-31 标准 化 典型 判别 函数 图 19-32 未 标准 化 典型 判别 函数 


(5) 分 类 函数 系数 , 在 图 19-33 中 , 结果 虽然 写 着 Fisher 判别 , 其 实 为 Bayes 判别 函数 。 
Y (结核 性 肺炎 ) =-4.830+0.035xx,+2.160xxs+4.246xx.+0.059xxs+0.094xx, 
到 (化 脓 性 肺炎 ) =-14.195+0.152xx,+4.559xx,+4.446xx.+0.144xx,。-0.061xx; 
(细菌 性 肺炎 ) -6.980+0.072xxj+2.062xxs+1.642xxs+0.122xxs+0.106xx, 
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运用 该 判别 式 时 ， 将 某 患 者 的 5 项 指标 分 别 代 入 这 3 个 方程 ， 得 分 最 大 的 ， 就 判别 
该 患者 属于 该 类 别 。 
(6) 分 类 结果 ， 如 图 19-34 所 示 ， 结 果 显 示 对 原始 数据 准确 分 类 率 为 86.3%， 交 又 
验证 准确 率 为 81.3%。 


分 类 结果 > 
预测 组 成 员 信息 
肺炎 灶 型 1 2 3 总 计 
原始 计数 ”1 25 0 5 30 
2 0 20 2 22 
3 3 2 24 28 
% 1 83.3 0.0 16.7 100.0 
2 0.0 90.9 9 1 100.0 
3 7.1 7.1 85.7 100.0 
交叉 验证 ” 计数 1 23 1 6 3 
肺炎 苹 鱼 2 4 18 0 22 
1 = 3 2 2 24 28 
x1 0.035 0.152 0.072 3 00 1000 
X3 2.160 4.559 2.062 3 182 818 00 1000 
x5 4.246 4.446 1.642 3 71 71 857 1000 
x6 0.059 0.144 0.122 a 正确 地 对 86.3% 个 原始 已 分 组 个 案 进 行 了 分 类 。 
x7 0.094 -0.061 0.106 


b. 仅 针对 分 析 中 的 个 案 进行 交叉 验证 "在 交 义 验证 中 ' 每 个 个 案 都 由 那些 从 
该 个 案 以 外 的 所 有 个 案 派 生 的 轴 数 进行 分 类 : 
Cc. 正确 地 对 81.3% 个 进行 了 交 文 验证 的 已 分 组 个 案 进 行 了 了 分类: 


图 19-34 分 类 结果 


(常量 ) -4.830 
费 希 尔 线 性 判别 函数 


图 19-33 ”Bayes 判别 函数 


-14.195 -6.980 


(7) 数据 库 视 图 ， 如 图 19-35 所 示 ，Dis_1 为 判别 分 析 的 结果 ，Disl 1 和 Dis2 1 为 
Fisher 判别 得 分 ， 根 据 该 得 分 结合 区 域 图 判定 结果 ; Disl 2、Dis2 2、Dis3 2 为 Bayes 判 
于 1 关 ， 


0. 23797 
0. 98387 


0., 76961 
0., 14734 


0. 96091 
0. 99453 
0. 99854 
0. 96416 
0. 85575 


19.4.7 ”知识 小 结 
聚 类 分 析 是 尝试 性 的 ， 探 索性 分 析 ， 


0. 00727 
0. 13892 
0. 00045 
0. 00182 
0. 00029 
0. 00017 
0. 00254 


只 是 根据 空间 距离 的 远近 进行 聚 类 ， 


聚 拓 无 方 
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程 和 模型 ， 判 别 分 析 是 给 予 一 批 已 知 分 类 的 样品 ， 软 件 目 动 识别 并 构建 判别 模型 ， 利 用 
模型 可 以 对 未 知 样品 进行 分 类 。 
上 面 介绍 的 都 是 常见 的 聚 类 ， 聚 类 分 析 类 型 与 选择 见 图 19-36。 


聚 类 分 析 导 图 
一 指标 聚 类 


法 ， 有 序 样品 聚 类 


方法 ， 快 速 聚 类 


方法 ， 决 策 树 聚 类 
是 上 人 方法 ;系统 聚 类 
图 19-36 ” 聚 类 方法 与 选择 


> “第 20 章 ， 主 成 分 与 因子 分 析 


学 习 统 计较 为 困难 的 ， 就 是 高 级 找 关 系 ， 即 建 模 研 究 ， 发 现 数据 之 间 的 内 在 规律 。 
而 我 们 在 前 面 学 习 线 性 回归 、Logistic 回归 或 者 Cox 回归 时 ， 当 自 变量 数 日 较 多 时 ， 意 
味 着 需要 更 多 的 样本 量 ， 然 而 在 某 些 情况 下 ， 样 本 量 不 是 那么 容易 获取 的 ， 如 一 些 罕见 
疾病 、 政 治 区 域 性 研究 等 。 因 此 ， 自 变量 数目 并 不 是 越 多 越 好 ， 应 该 适度 最 好 ， 然 而 在 
我 们 根据 专业 意义 ， 拿 到 的 众多 目 变 量 中 ， 到 底 该 如 何 取舍 ， 统 计 学 上 能 否 给 我 们 以 一 
定 的 启示 呢 ? 


> 20.1 主 成 分 分 析 


20.1.1 主 成 分 思想 


万 物 一 理 ， 听 故事 ， 学 统计 ， 故 事 听 懂 了 ， 统 计 也 就 学 会 了 ! 
小 故事 1: 母 鸡 孵 蛋 

在 没有 人 工 徐 化 技术 时 ， 小 鸡 的 畴 化 都 是 老母 鸡 的 事 ， 鸡 窜 里 通常 放 30 ~ 40 只 蛋 ， 
母 鸡 坐 于 鸡蛋 之 上 ， 用 体温 筹 化 小 鸡 ， 一 般 21 天 左右 ， 小 鸡 就 可 以 破 完 而 出 ， 当 然 也 有 
出 不 来 的 ， 通 常 被 称 为 “坏蛋 ”。 试 想 一 下 ， 如 果 一 下 给 母 鸡 200 个 蛋 让 它 去 筹 化 ， 一 
只 母 鸡 是 肯定 驾驭 不 了 的 。 如 果 把 鸡蛋 比喻 为 自 变量 ( 工 ) ， 母 鸡 比 喻 为 因 变 量 (了 ) ， 
这 就 意味 着 ， 自 变量 蕊 如 果 太 多 的 话 ， 对 于 一 个 模型 ， 也 是 不 能 承受 的 。 如 果 母 鸡 只 铸 
化 几 个 鸡蛋 ， 对 鸡蛋 而 言 ， 会 受到 很 好 的 照顾 ， 但 浪费 了 母 鸡 的 能 力 ， 也 就 是 说 ， 几 个 
自 交 量 ( 卫 ) 并 不 能 完全 解释 因 变 量 (了 ) 。 这 个 故事 告诉 我 们 ， 自 变量 太 少 则 不 能 完美 
解释 了 ， 自 变量 太 多 ,对 样本 量 需求 较 大 ， 同 时 会 导致 对 了 过 度 解释 。 


小 故事 2: 金融 融资 
虚构 一 个 例子 ， 比 如 有 50 名 投资 人 ， 每 人 手 里 都 有 1000 元 ， 松 哥 想 通过 自己 的 花 
言 巧 语 ， 让 50 名 投资 人 的 钱 都 投资 给 我 ， 可 是 松 可 忽悠 人 的 能 力 太 差 ， 仅 赁 自己 1 个 人 
去 劝 服 50 人 难度 太 大 ; 于 是 松 哥 就 洲 请 了 马云 、 马 化 腾 和 刘强 东 ， 比 如 马云 从 每 人 手 里 
拿 走 400， 马 化 腾 拿 走 300， 刘 强 东 拿 走 250， 大 家 手 里 只 剩 50 元。 于 是 松 哥 也 没有 必 
要 去 花 精 力 劝 服 大 家 ， 因 为 大 家 手 里 已 经 没 哈 钱 了 ，, 松 哥 只 要 能 把 “二 马 一 刘 ” 劝 说 好 ， 
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让 三 位 的 钱 投 资 给 自己 ， 就 可 以 了 。 因 为 三 位 大 牛 的 钱 ， 就 来 自 50 位 投资 人 ， 三 位 大 牛 
就 是 50 位 投资 人 的 信息 浓缩 。 这 就 是 主 成 分 分 析 思 想 ， 对 信息 进行 浓缩 降 维 。 如 果 松 哥 
是 (了) ，50 位 投资 人 是 碟 松 哥 是 处 理 不 了 50 个 自 变量 不 的 ， 但 浓缩 后 ， 处 理 三 个 己 
还 是 绰绰有余 的 。 

对 于 本 例 ， 一 些 人 认为 变量 筛选 就 是 直接 将 50 个 人 删除 47 个 ， 然 后 对 剩 下 的 3 个 
进行 后 续 分 析 ， 事 实 上 主 成 分 的 思想 并 不 是 这 样 ， 其 实 任何 一 个 丈 都 没有 删除 ， 每 一 个 
了 都 参与 到 后 续 分 析 了 ， 因 为 松 哥 通过 “二 马 一 刘 ” 其 实 拿 到 了 每 一 位 投资 人 的 钱 。 在 
统计 分 析 时 , “二 马 一 刘 ” 并 不 是 真实 存在 ， 是 虚构 出 来 的 变量 , 我 们 把 它们 叫 作 主 成 分 。 
以 松 哥 为 了 以 “二 马 一 刘 ” 为 卫 构 建 的 回归 ， 即 称 为 主 成 分 回归 。 

大 家 再 试想 一 下 ， 本 例 中 我 们 请 了 3 位 大 咖 来 获取 大 家 的 投资 额 ， 请 问 松 哥 最 多 可 
以 请 多 少 个 大 咖 来 呢 ， 最 多 50 个 ， 为 什么 呢 ? 因为 如 果 请 的 人 数 超 过 50， 松 哥 还 不 如 
直接 对 这 50 名 投资 人 进行 忽悠 呢 ， 干 吗 去 请 那么 多 大 咖 ， 请 大 咖 就 是 为 了 能 够 省 事 ， 让 
几 个 大 咖 就 把 大 家 的 钱 给 控 取 出来。 正常 的 情况 下 ， 如 果 数 据 质量 较 好 ， 一 般 3 一 5 个 
大 咖 就 可 以 把 投资 人 手 里 的 资金 提取 的 差不多 了 。 

主 成 分 的 思想 ， 其 实 就 含 在 式 〈20-1) 到 式 〈20-3) 中 。 


了 (20-1) 
YH tH dt th pAp (20-2) 
Yo-MpiA tHp A st"** tpp dp (203) 


小 故事 3: 喝 中 药 汤 

一 天 松 哥 生病 了 ， 去 医院 找 个 老 中 医 看 病 ， 老 中 医 给 开 了 一 大 包 中 药 ， 让 回 家 元 中 
药 喝 。 于 是 松 哥 回 家 洗 药 加 水 者 了 一 大 锅 ， 考 好 后 ， 拿 出 处 方 看 看 喝 药 方法 ， 上 面 写 着 
两 个 大 字 “ 顿 服 ”， 妈 呀 ， 顿 服 是 一 顿 喝 完 ， 可 是 松本 水 加 太 多 了 ， 满 满 一 锅 水 呢 ? 怎 
么 办 呢 ， 于 是 松 哥 继续 开 着 小 火 ， 将 水 分 蒸发 掉 ， 自 己 跑 淮 边 看 去 写 SPSS 书 ， 一 下 写 
入 迷 忘 了 者 药 这 事 ， 过 了 很 长 一 段 时 间 ， 突 然 想起 ， 赶 紧 关 火 ， 发 现 里 面 的 药 汤 只 剩 一 
酒杯 ， 一 仰 脖子 就 可 以 喝 完 。 貌 似 没 问题 ， 可 是 我 们 知道 ， 随 着 水 分 的 蒸发 ， 其 实 有 效 
药物 成 分 也 会 蒸发 或 者 降解 ， 因 此 ， 如 此 浓缩 是 有 问题 的 。 

如 果 药 汤 代 表 目 变量 也 松 哥 代表 开始 时 式 太 多 ， 松 哥 喝 不 下 ， 后 来 式 太 少 ， 
治 不 了 松 哥 的 病 。 而 浓缩 药 汤 的 过 程 其 实 就 是 信息 浓缩 的 过 程 ， 看 来 ， 浓 缩 的 不 一 定 都 
是 精华 ， 浓 缩 也 要 把 握 一 个 度 。 那 么 在 统计 学 上 到 底 浓 缩 到 什么 程度 呢 ? 一 般 在 生物 医 
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药 领域 ， 浓 缩 的 成 分 应 该 包括 全 部 信息 的 85% 以 上 。 但 社会 科学 因为 影响 与 不 可 控 因 素 
较 多 ， 能 达到 70% 已 经 不 错 。 对 于 本 例 ， 也 融 是 当 有 效 药 物 成 分 在 蒸发 过 程 中 ， 只 剩 
85% 的 时 候 ， 建 议 赶 楷 停 火 ， 因 为 再 继续 蒸发 ， 可 能 就 不 能 治 病 了 。 


小 故事 4: 单位 裁员 

某 单 位 经 济 不 景气 ， 老 板 决 定 裁员 ， 请 问 老板 根据 啥 条 件 裁 员 呢 ? 对， 就 是 员工 的 
工作 能 力 ， 在 统计 分 析 中 ,每 个 提取 出 的 主 成 分 也 有 自己 的 能 力 ， 指 标 就 是 “特征 值 ”。 
试想 一 下 ， 故 事 1 中 ， 松 哥 最 多 可 以 请 50 位 大 咖 来 提取 50 个 投资 人 的 资金 ， 但 每 位 大 
咖 都 有 自己 的 忽悠 能 力 ( 特征 值 ) ， 只 有 特征 值 >1 的 ， 松 哥 才 考虑 邀请 ， 并 且 特 征 值 越 
大 ， 越 应 该 先 邀 请 。 但 万 一 特征 值 大 于 1 的 只 有 1 个 人 (比如 马云 ) ， 其 可 以 将 50 位 投 
资 人 资金 的 40% 挖 取出 来 ， 但 剩 下 还 有 60%， 太 多 了 ， 因 此 ， 尽 管 后 面 的 大 咖 特 征 值 小 
于 1， 也 得 将 就 着 邀请 来 ， 帮 着 尽量 多 地 提取 到 80% 以 上 吧 。 

主 成 分 分 析 虽 然 是 信息 浓缩 ， 但 浓缩 不 是 主 成 分 的 目的 ， 浓 缩 完 做 什么 才 是 目的 ， 
主 成 分 分 析 有 两 个 主要 的 用 途 ， 一 是 主 成 分 回归 ， 二 是 主 成 分 评价 。 注 意 : SPSS 软件 没 
有 独立 的 主 成 分 分 析 模 块 ，SPSS 实现 主 成 分 分 析 是 借助 因子 分 析 模 块 实现 的 。 


20.1.2” 主 成 分 分 析 


案例 实战 

松 哥 有 个 杀 威 ， 他 们 村 好 多 居民 出 现 了 污染 物 中 毒 症 状 。 村 周边 有 个 开发 区 ， 村 民 
认为 都 是 开发 区 的 4 企业 排除 污染 物 导 致 ， 于 是 村 民 围 堵 4 企业 ， 双 方 发 生 冲 突 ， 村 民 
联名 将 开发 区 4 企业 告 上 法 庭 。 该 企业 辩解 ， 开 发 区 有 多 家 企业 ， 大 家 也 都 有 污染 物 的 
排放 ， 凭 喻 认为 就 是 4 企业 导致 的 呢 ? 是 的 呀 ， 村 民 也 没有 依据 呀 ， 因 为 松 哥 在 某 医 科 
大 学 教书 ， 于 是 亲 威 就 咨询 松 哥 怎么 办 ， 于 是 松 哥 邀请 环境 健康 教研 室 的 陈 老师 一 起 来 
到 该 村 。 我 们 在 该 村 的 村 里 村 外 共 15 个 点 进行 了 空气 和 土壤 采样 ， 将 样品 带 回 实验 室 进 
行 污染 物 检测 ， 最 终 获 得 数据 ， 建 数据 库 data20.1.sav。 

实战 步骤 

(1) 分 析 一 降 维 一 因子 : 弹出 图 20-1， 将 6 种 污染 物 放 入 变量 框 中 ， 点 击 “ 描 述 ” 
按钮 。 弹 出 图 20-2， 勾 选 “ 系 数 ” 和 “KMO 和 巴特 利 特 球形 度 检 验 ”。 

(2) 提取 设置 : 如 图 20-3 所 示 ， 方 法 选择 “ 主 成 分 ”， 此 时 不 能 更 改 其 他 方法 ， 否 
则 就 不 叫 主 成 分 分 析 了 ; 输出 默认 “未 旋转 因子 解 ”， 并 勾 选 “ 碎 石 图 ”， 该 图 用 于 从 
图 示 角 度 判 定 提 取 几 个 主 成 分 较为 合适 ， 提 取 标 准 先 默认 “基于 特征 值 大 于 1”， 看 提取 
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的 结果 ， 如 果 特 征 值 大 于 1 发 现 提 取 的 信息 量 不 够 ， 则 降低 标准 ， 如 特征 值 >0.8，>0.6， 
或 者 直接 根据 特征 值 >1 的 结果 ， 直 接 选 择 “ 固 定 因 子 数目 ” 


ET 
钱 伦 氢 ] 
笑 #1E 哲 ] 


最 大 收 吞 汉人 次 数 人 :|25 | 


图 20-1 因子 分 析 界面 图 20-2 因子 分 析 : 描述 。 图 20-3 因子 分 析 : 提取 
继续 ”， 回 到 图 20-1， 点 击 “确定 ”运行 


相 尖 性 息 阵 
氢化 物 硫化 所 ” 铅 化 物 。 ”条 化 物 。” 环 氧 氢 两 烷 。 ” 环 己 烷 
相关 性 。 氢化 物 1.000 -0219 -0.570 0.526 -0.523 -0.346 
踊 化 氢 -0.219 1.000 -0.233 0.049 0.536 -0.546 
铅 化物 -0.570 -0.233 1.000 -0.494 0.117 0.716 
冬 化 物 0.526 0.049 -0.494 1.000 0.033 -0.506 
环 虎 令 两 棕 。 -0.523 0.536 0.117 0.033 1.000 -0.197 
环 已 烷 -0.346 -0.546 0.716 -0.506 -0.197 1.000 


图 20-4 ”相关 矩阵 结果 


(2) KMO 检验 : 如 图 20-5 所 示 ，KMO=0.650， 球 形 度 检验 
行 主 成 分 分 析 。 此 处 判断 标准 是 ，KMO>0.5，P<0.05 则 适合 做 主 成 分 分 析 。 

(3) 公 因 子 方差 : 如 果 每 个 变量 包含 信息 为 1 的 话 ， 此 处 进行 主 成 分 的 提取 ， 每 个 
变量 到 底 有 多 少 信息 能 够 被 提取 出 来 ， 结 果 图 21-6 发 现 除 孙 化物 外 ， 其 他 提出 的 信息 
均 还 可 以 。 就 像 前 面 故 事 所 说 ，“ 二 马 一 刘 ” 把 50 个 人 的 钱 忽 悠 了 多 少 一 样 的 道理 哦 ， 
提取 的 越 多 ， 说 明 信 息 浓缩 得 越 好 。 


对 | 此 本 


公 因 直方 束 
初始 
扬 化 物 1.000 
KMO 和 巴特 利生 检验 友 化 氯 1.000 
KMO 取样 适 切 性 最 数 - 铝 化 物 1.000 
巴特 利 特 球形 度 检验 ”近似 卡 方 . 未 化 物 1.000 
自由 讼 16 环 氧气 丙烷 1.000 
| 环 已 烷 1.000 


一 让 
显 者 性 — - 一 一 一 
ed he 提 朗 方法 : 主 成 分 分 析 法 ， 


图 20-5 KMO 检验 图 20-6 公 因 子 方差 
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体 的 多 少 信息 。 
待人 人 值 为 2.657， 
成 分 2 的 特征 值 为 1.953， 两 者 总 共 可 以 解释 总 变异 的 76.842%。 或 者 可 以 理解 现在 只 有 
马云 和 马化腾 ， 这 两 位 大 咖 将 50 个 投资 人 的 76.842% 的 钱 提 取出 来 了 ， 可 是 不 够 ， 看 来 
还 得 再 请 刘强 东 , 从 图 20-7 可 见 , 如 果 和 再 增加 一 个 大 咖 , 即 成 分 3， 虽 然 特 征 值 只 有 0.667， 
但 成 分 3 的 加 入 ， 将 能 够 提取 出 50 位 投资 人 的 87.961% 的 投资 额度 ， 己 经 非常 不 错 了 ， 
于 是 决定 ， 增 加 提取 第 3 个 主 成 分 。 


总 方差 解 尾 
初始 特征 值 ”提取 载荷 平方 和 旋转 载荷 平方 和 
成 分 总 计 二 困 积 % 总 计 方 苦 百 分 比 累积 % 总 计 方 北 百分比 。 累积 %% 


2 1.953 J2.551 76.842 1.953 32.551 76.842 1.957 32.618 76.842 
4 0.314 5.231 93.192 
9 U222 3.103 96.895 
6 0.186 3.105 100.000 


提取 方法 : 主 成 分 分 析 法 
图 20-7 总 方差 解释 
(5) 重新 调整 ， 因为 刚才 按照 工作 能 力 《〈 特 征 值 >1) ， 仅 能 提取 76.842%， 不 够 ， 


因此 增加 提取 ， 重 新 操作 图 20-3， 改 成 图 20-8， 提 取 因 子 数 设 置 为 “3”。 对 于 本 例 ， 
设置 特征 值 >0.6， 也 可 以 实现 同样 目的 。 


一 iiE 一 一 -一 一 - | 
末 旋 转 因 子 解 伍 ) 
| 雄 石 图 (S) 


提取 
| | 全 基于 特征 值 E) 


特征 值 大 于 的: 1 


图 20-8 因子 分 析 : 提取 


(6) 再 次 分 析 绪 果 : 前 面 表格 结果 变化 不 大 ,找到 提取 总 方 兰 解 释 ， 如 图 20-9 所 示 。 
发 现 软件 最 终 提取 了 3 个 主 成 分 。 可 以 解释 87.9619%， 已 经 大 于 85%， 忆 体 效果 不 错 。 
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成 分 

1 

2 

3 . 

| 031 5 73T 93197 
5 0.222 3.703 96.895 
6 0.186 3.105 100.000 


提取 方法 : 主 成 分 分 析 法 ; 


图 20-9 ”总 方差 解释 


(7) 雄 石 图 : 又 称 为 山体 滑坡 图 ， 山 坡 上 越 高 的 点 ， 其 势能 越 大 ， 对 于 研究 而 言 就 
越 重要 。 因 此 图 20-10 中 ， 重 要 性 方面 1>2>3。 图 示 如 何 判定 选取 几 个 主 成 分 呢 ? 就 是 
过 了 该 点 之 后 的 点 基本 处 于 水 平 ， 因 此 本 例 图 示 也 建议 取 3 个 主 成 分 较为 合适 。 

(8) 成 分 矩阵 : 如 图 20-11 所 示 ， 注 意 此 处 成 分 矩阵 并 不 是 成 分 系数 ， 要 想 拿 到 我 
们 提取 的 3 个 主 成 分 ， 还 需要 经 过 几 步 计算 。 


成 分 窍 阵 ” 
成 分 

1 2 3 
疡 化 牺 -0.699 -0.603 -0.020 
硫化 氢 -0.313 0D.821 -0.282 
窜 化 物 ] 0.881 0.034 0.241 
未 化 牺 -0.752 -0.083 0.613 
环 饼 氢 同 过 0.066 0.873 0.364 
环 己 烷 D0.8951 -0.366 0D.144 

1 3 4 S 6 提取 方法 : 主 成 分 分 析 法 * 
组 件 号 a. 提取 了 3 个 成 分 : 
图 20-10” 碎 石 图 20-11 成 分 矩阵 


主 成 分 的 计算 

主 成 分 的 计算 ， 其 实 就 是 构建 主 成 分 与 原始 目 变 量 之 间 的 方程 。 因 为 SPSS 没有 直 
接 进 行 主 成 分 分 析 的 模块 ， 因 此 无 法 直接 生成 主 成 分 ， 需 要 手动 计算 。 通 第 有 两 种 方式 ; 
一 是 用 图 20-11 中 的 成 分 载荷 除 以 各 自 的 特征 值得 到 主 成 分 系数 ， 然 后 用 主 成 分 系数 除 
以 标准 化 后 的 目 变 量 X。 二 是 利用 未 旋转 因子 分 析 的 得 分 系数 乘 以 特征 值 ， 然 后 再 乘 以 
标准 化 的 目 变 量 民 两 种 结果 几乎 一 致 ， 先 学 第 一 种 。 
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(1) 产生 主 成 分 系数 : 新 建 一 个 SPSS 空白 数据 (CCtrHN) ， 将 图 20-11 成 分 载荷 
双击 激活 后 复制 至 空白 数据 ， 并 命名 aa、ama 和 a;3， 如 图 20-12 所 示 。 


咏 无 标 本 4saw 欧 所 让 可 - 四 网 5ps5 Statistics 数 丘 编程 品 
sl | | li 


百 


dl | 2 dy | 2 
0.699 -0.603 -0.020 
0. 313 0.827 -0. 282 


0.881 0.034 0.24] 
-0.752 -0.083 0.613 

0.066 0.873 0.364 

0.851 -0.366 0.144 


1BM SPSS Staisilcs 地 理 查 序 就 站 | | [nicoge:OMN | 


图 20-12 ”成 分 载荷 


(2) 计算 主 成 分 系数 :转换 一 计算 变量 ， 生 成 bl、b, 和 bb; 主 成 分 系数 ，bi=ai 除 以 
根 号 下 成 分 1 的 特征 值 , 如 图 20-13 所 示 。 继续 计算 b=a, /sqrt(1.953); by= a;/ sqrt(0.667)。 


a -0. 699 -0.603 -0. 020 -0. 43 -0. 43 -0. 02 
[asqnt2 2 -0.313 0.827 -0.282 -0. 19 0. 59 -0. 35 
0.881 0.034 0.241 0. 54 0. 02 0. 30 
Er -0.752 -0.083 0.613 -0. 46 -0. 06 0. 75 
i I 4 0.066 0.873 0.364 0.04 0. 62 0. 45 
NR | 0.851 -0,366 0.144 0. 52 -0, 26 0, 18 

图 20-13” 主 成 分 系数 计算 图 20-14 ”成 分 载荷 与 主 成 分 系数 


(3) 原始 数据 标准 化 : 回 到 主 成 分 分 析 数 据 库 ， 分 析 一 描述 统计 一 朱 述 。 如 和 图 
20-15 所 示 ， 将 6 个 变量 放 入 框 中 ， 勾 选 “ 标 准 化 值 另存 为 变量 ”， 点 击 “确定 ”。 数 据 
库 中 产生 6 个 标准 化 后 的 变量 。 


[六 站 化 物 [ 扎 化物] 


一 J | 六 订 佬 国人 
| 环 鱼 所 商 壳 也 气 气 … 


| | 过 环 已 这 [时 己 本 ] 


Hs 
辐 | 司 标 蕉 七 | 天 另存 六 亚 县 世 赂 一 


图 20-15 ”统计 描述 


(4) 计算 主 成 分 : 主 成 分 的 计算 公式 为 主 成 分 系数 乘 以 标准 化 后 的 了。 大 家 复制 b 
所 有 的 系数 ， 回 到 主 成 分 数据 库 data20.1.sav; 转换 一 计算 变量 ， 如 图 20-16 所 示 。 
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作 提 化 物 放 化 物 ] mm, ns 
依 硫化 氨 畏 化 氢 ] 和 国 数 明 人 G): 


20-16 ” 主 成 分 计算 表达 式 


(5) 计算 主 成 分 : 

人 二 一 0.43XZ 和 化 物 ~0.19 X 色 靖 化 所 十 0.34 X 全 铅 化 物 一 0.46 X 妈 采 化 物 十 0.04 X 么 环 气氛 丙烷 +0.32 Xx 
乙 环 已 烷 

LO 一 -0.43xX 人 所 化物 十 0.39x 人 包 硫 化 氢 十 0.02 X 公 铅 化 物 -0.06x 全 采 化 物 十 0.62 X 妈 环 氧 氧 两 烷 一 0.26 Xx 
乙 环 已 烷 

LA 二 -0.02XL 员 化 物 -0.32 X 色 闹 化 氧 十 0.30 X 色 铅 化 物 士 O. 13 X 全 采 化 物 十 0.42 X 和 环 氧 氧 丙烷 十 U.Sx 
乙 环 已 煤 

由 此 可 见 ， 成 分 Z 主要 依赖 铅 化 物 和 环 己 烷 ; 纪 依赖 环 氧 氯 两 烷 ，Z 依赖 未 化 物 ; 
也 束 是 说 当地 的 污染 物 虽 然 检测 到 6 种 ， 但 主要 由 上 面 4 种 构成 。 于 是 建议 环境 部 门 对 
该 企业 生产 工艺 的 主要 污染 物 进 行 分 析 ， 发 现 恰 恰 正 是 上 述 4 种 污染 物 ， 因 此 ， 有 足够 
的 理由 认为 ， 该 A 企业 为 当地 的 主要 污染 企业 。 本 故事 纯 属 虚构 ， 仪 做 演示 ， 请 勿 当真 。 

(6) 主 成 分 呈现 : 回 到 数据 视图 ， 在 最 右边 ， 产 生 Z、 思 和 有 三 个 主 成 分 。 

知识 拓展 

1. 主 成 分 分 析 不 是 一 步 到 位 的 ， 先 按照 特征 值 大 于 1 进行 预 分 析 ， 如 果 可 解释 的 总 
方差 达到 研究 要 求 ， 如 85% 以 上 ， 则 OK; 如 果 可 解释 总 方差 较 小 ， 则 需要 增加 提取 成 
分 的 数目 ; 

2. 碎 石 图 是 定性 地 帮助 判断 提取 几 个 主 成 分 ， 一 般 目测 为 该 点 之 后 的 点 与 广 轴 近似 
平行 ， 但 也 有 专门 的 平行 性 检验 ， 请 参考 相关 书籍 。 

3. KMO 最 大 值 为 1，KMO>0.9 为 效果 最 佳 ，0.7 以 上 可 以 接受 ，0.5 以 下 不 宣 做 主 成 
分 分 析 。 


20.1.3” 主 成 分 回归 


当 我 们 进行 线性 回归 时 ， 大 目 变 量 间 存 在 多 重 共 线性 ， 则 会 影响 方程 的 真实 性 ， 我 
们 可 以 采用 逐步 回归 、 岭 回归 及 主 成 分 回归 的 方法 消除 共 线 性 的 影响 。 本 节 就 来 说 说 主 
成 分 回归 。 主 成 分 回归 就 是 对 多 个 目 变 量 先进 行 主 成 分 分 析 , 提取 出 相互 独立 的 主 成 分 ， 
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然后 骨 进 行人 线性 回归 分 析 。 


案例 实战 

茶 研 究 者 研究 了 与 5 个 x 的 线性 回归 关系 ,先进 行 了 线性 回归 ， 及 现存 在 和 
考虑 采用 主 成 分 回归 ， 看 如 何 实现 《案例 数据 data20.2.sav) 。 

实战 步 又 

1. 打开 数据 ， 将 原始 变量 x 一 x; 以 及 了 进行 数据 标准 化 ， 分析 一 描述 统计 一 描述 ， 
将 竺 标准 化 变量 放 入 框 中 ， 勾 选 “ 标 准 化 另存 为 变量 ” 即 可 。 有 共 体 可 参照 前 述 案 例 。 

2. 分 析 一 回归 一 线性 ; 如 图 20-17 所 示 ， 将 标准 化 了 ( 力 ) 放 入 因 变 量 ， 标 准 化 
Zx 一 Zxs 放 入 目 变 量 

3 eh “统计 ”， 如 图 20-18 所 示 ， 义 选 “ 共 线性 诊断 ”， 点 击 “ 继 续 ”。 


已 


回 髓 年 者 棋 型 执 合 (MM) 
估算 慎 (E) 辐 民 方 变化 量 (3) 
置信 区 间 (N) 回 人 


报 别 (%) : 95 
oF ZEONB2) EO Zscorelr3) [Cy] 
| | Zecoret3) Pal 4 | 7 zscore0) El 协 方 荐 短 阵 (V) 
Zeeretid) [Ed] rd)Ee] 
2- 过 SCOTE 人 SI [Zs] | 际 董 


TE 德 牢 - 天 森 (U) 
渴 择 焉 县 [E) ; 个 案 论断 (GC) 
| IE i 
大 高 群 值 /D) : 
| 个 案 征 焉 从 ) 
*L | 所 有 个 案 ( 和 A) 
， WLS 机 重 (H): 
+ 


图 20-17 线性 回归 图 20-18 ”线性 回归 : 估计 


4. 初步 结果 : 结合 前 面 的 线性 回归 ， 结 果 大 家 应 该 都 会 看 ， 此 处 仪 ; 
发 现 方差 膨胀 因子 (VIF) 多 个 指标 大 于 10, 存在 高 度 的 共 


外 类 [ 
未 标准 化 夭 北 标 礁 化 系数 

模型 日 标准 识 差 Beta 

(常量 ) 2.883E-16 0.030 0.000 1.000 
Zscore(x1) -2.265 3.017 -2.265 -0.751 0.468 0.000 9443.791 
Zscore(x?) 0.195 0.087 0.195 2.241 0.047 0.127 7.853 
Zscore(x3) 3.354 2.907 3.354 1.154 0.273 0.000 8771.571 
Zscore(x4) -0.191 0.148 -0.191 -1.286 0225 ‖ 0044 22879 
Zscore(x5) -0.156 0.065 -0.156 -2.417 0.034 0.231 4.338 


a. 国 变量 : 2Zscore 人 (y 


图 20-19” 共 线性 诊断 
5. 主 成 分 提取 : 分 析 一 降 维 一 因子 ， 将 ZUxi 一 Zxs 放 入 变量 框 ， 如 图 20-20 所 示 ， 点 
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击 “ 提 取 ”， 如 图 20-21 所 示 ， 选 拌 固定 因子 数量 为 2。 注 意 ， 本 例 松 哥 已 经 预 分 析 友 现 
提取 两 个 信息 星 才 足 够 ， 各 位 分 析 目 己 数 据 的 时 候 ， 也 要 先行 预 分 析 一 下 哦 


[2x1] 
[2a] 
[2x3] 
[Zx4] 
oD Zscoretx5) [Zx5] 


加 选择 变量 (CG) : 


[| 


图 20-20 ”因子 分 析 图 20-21 ”因子 分 析 : 提取 


6. 反击 “得 分 ”， 如 图 20-22 所 示 ， 选 择 “ 保 存 为 变量 ”， 点 击 “ 继 续 ”， 回 到 主 
成 分 窗口 运行 。 

前 面 说 计算 主 成 分 有 两 种 方法 ， 现 在 即将 阐明 的 就 是 第 二 种 方法 

7. 主 成 分 结果 : 如 图 20-23 所 示 ， 提 取 2 个 主 成 分 ， 可 解释 总 方差 为 97.276%， 已 
经 远 远 大 于 85%。 说 明 提取 2 个 已 经 足够 。 


蚊 BF5f: 4S” 屠 济 | 总 方差 解 坚 
问 始 特征 值 提取 载荷 平方 和 
总 计 片 董 目 分 比 累积 兄 总 计 方 盖 百分比 累积 % 


83.928 83.928 4.196 83.928 83.928 
13.349 97.276 0.667 13.349 97.276 


局 加 时) 
岛 巴 特 利 特 但 ) 
六 去 德 称 - 音 起 二 | 


5.490E-6 0.001 ”100.000 
取 方 法 : 主 成 分 分 析 法 


| 同 显示 因子 得 分 钊 数 矩阵 上 D) 


图 20-22 ”因子 得 分 图 20-23 ”总 方差 解释 


此 时 在 数据 库 产生 2 个 未 旋转 的 因子 得 分 ， 如 图 20-24 所 示 ，FAC1 1 和 FAC2 1， 
现在 利用 因子 得 分 去 计算 两 个 主 成 分 ZZ 和 乙 。 

8. 转换 一 计算 变量 

Zi=FAC1 1xsqrt (4.196) ; Z=FAC2 1xsqrt (0.667) ， 于 是 数据 库 中 ， 生 成 2 和 忆 
主 成 分 ， 如 图 20-24 所 示 。 

9. 主 成 分 回归 : 利用 标准 化 字 为 因 变 量 ， 主 成 分 Z| 和 万 为 目 
由 图 20-25 日 Diao 意义 的 ，F=181.766，P=0.000<0.05。 

加 居 方程 从 中 20-26， 共 线性 诊断 肥 现 没有 共 线 性 ， 回 归 方 程 为 2y=0.974xZ1-0.117x 


量 ， 再 次 进行 回归 |; 
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| “FAC1 1 | *#*FAC2 1 | zl P22 | ANOVAa 
-0.88441 -0. 37448 -1.81 _0. 31 
i 
-0. 56867 1. 35995 -1.16 1.11 异型 平方 和 日 由 展 
-0. 88313 -0. 50161 -1. 81 0. 41 1 回 扫 15.407 < 
-0.85070 -0. 89646 -1 74 0.73 残 莽 0.593 14 0.042 
-0. 60667 0. 22084 _1. 24 0. 18 总 计 16 000 16 
-0. 67600 -0. 46826 = 0. 38 -== 
-0. 55952 0. 27529 -1. 15 0. 22 a. 因 变 量 : Zscorely) 
-0. 59548 -0. 06333 -1.22 0. 05 b. 预测 变量 : (常量 ), z2, z1 
图 20-24 主 成 分 图 20-25 ”回归 方程 检验 
EP 届 
未 标准 化 系数 已 玫 
-5.124E-17 0.000 1.000 
z1 0.476 0.025 0.974 〗 18.930 0.000 
z2 -0.144 0.063 -0.117 © -2.278 
a. 国 变量 : AStorely) 
20-26” 共 线性 诊断 
一 第 和 
10. 标准 方程 还 原 : 


结合 前 面 案例 ， 大 家 可 以 计算 出 2 个 主 成 分 的 公式 为 : 

Z=0.67xZx,+0.63xZx,+0.67xZx,+0.64xZx,+0.46x2Zx. 

Z=-0.002xZx,-0.3355xZx,-0.0012xZx,-0.311xZx,+0.889xZx. 

将 志和 万 代入 式 1， 可 以 得 到 标准 化 力 与 5 个 标准 化 Zrx 的 方程 ， 而 SPSS 中 标准 
I 利用 标准 化 公式 将 原始 变量 y 与 原始 变量 x 的 方 
程 反 解 出 来 即 可 ，SPSS 实现 主 成 分 回归 过 程 较 为 复杂 ， 需 要 较 多 的 手工 运算 辅助 ， 因 此 
主 成 分 回归 一 般 用 其 他 软件 实现 。 


20.1.4 主 成 分 评价 


主 成 分 评价 是 对 多 个 度量 衡 单位 不 同 资料 进行 综合 评价 的 方法 。 如 我 们 上 大 学 时 进 
行 的 文化 课 综合 成 绩 排名 ， 我 们 可 以 用 几 门 课程 的 成 绩 之 和 除 以 考 了 几 门 课 的 数目 ， 婚 
可 以 得 到 文化 课 的 综合 成 绩 ， 又 可 以 进行 排名 。 但 很 多 排名 ， 例 如 世界 500 强 企业 排名 ， 
世界 100 强 高 校 排名 ， 其 评价 指标 不 可 以 简单 相 加 求 平 均 。 

以 高 校 排名 为 例 ， 包 括 指标 很 多 ， 比 如 就 用 两 个 ， 每 年 课题 经 费 〈( 马 ) 和 发 表 SCI 
论文 影响 因子 〈 马 ) ，A 高 校 课 题 经 费 2 亿 元 ， 发 表 SCI 论文 10000 篇 ; B 高 校 课题 经 
费 1 亿 元 ， 发 表 SCI 论文 20000 坑 ， 你 说 两 个 学 校 综合 实力 到 底 谁 更 强 呢 ? 咀 们 不 能 直 
接 拿 课题 经 费 加 上 篇 数 除 以 2 求 平 均 ， 因 为 度量 衡 单 位 不 一 致 ， 没 有 可 比 性 。 那 我 们 该 
如 何 操作 呢 ? 主 成 分 综合 评价 就 是 解决 这 类 问题 的 一 种 方法 。 
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案例 实战 

搜集 2015 年 国家 统计 局 全 国 各 省 份 自治 区 11 项 经 济 指标 ， 现 采用 主 成 分 法 进行 经 
济 综合 排名 (数据 文件 data20.3.sav) 。 

实战 步骤 

(1) 先 主 成 分 预 分 析 ， 看 结果 如 何 ， 决 定 提取 几 个 主 成 分 因子 ， 因 为 上 面 已 经 多 次 
进行 主 成 分 分 析 ， 因 此 此 处 文字 描述 ， 重 要 部 分 截图 展示 。 

(2) 分 析 一 降 维 一 因子 分 析 : 将 11 项 经 济 指标 放 入 变量 框 ， 如 图 10-27 所 示 。 

(3) 摘 述 : 勾 选 系数 与 KMO。 

(4) 提取 : 默认 特征 值 >1。 

(5) 得 分 : 勺 选 “ 保 存 为 变量 ”， 采 用 回归 法 。 

结果 解读 

(1) KMO=0.763，P=0.000， 可 以 进行 主 成 分 分 析 。 

(2) 提取 3 个 主 成 分 ， 共 提取 93.403% 信息 ， 较 好 。 


总 方差 解释 
总 计 ” 方 着 百 分 比 ” 奈 积 % 总 计 方 荣 百 分 比 ” 奈 积 名 


11 0.009 0.086 100.000 
提取 方法 : 主 成 分 分 析 法 。 


20-27 总 方差 解释 


(3) 未 旋转 因子 得 分 ， 见 图 20-28 (A) 。 

(4) 计算 主 成 分 ， 采 用 第 二 种 方法 ， 见 图 20-28 (B) 。 

主 成 分 1: Z=FAC1 1xsqrt (6.271 ) 

主 成 分 2: Z=FAC2 1xsqrt (2.707) 

主 成 分 3: Z=FAC3 1xsqrt (1.296) 

(5) 计算 综合 排名 指数 (K) ， 利 用 SPSS-compnute 功能 ， 按 照 公式 : 
K= (6.271xZi+2.707xZ+1.296xZ;) / (6.271+2.707+1.296) 
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| 《FACL 1 


| @ 2. 89895| 
2. 41459 


1. 47011 
1. 76583 
VQ. 91677 
1. 31356 
0. 20152 
u,. 53164 
0. 21078 
-0. 29177 
-0. 12187 
0, 20205 
-0. 49060 


-1. 29270 
-0. 94562 
1. 37626 
0. 51921 
2. 13321 
-D0. 99587 
2.07748 
-0. 31332 
0. 06391 
0. 93127 
0. 34261 
0, 73921 
1. 54279 


因子 得 分 主 成 分 及 排名 


该 公式 其 实 就 是 将 各 主 成 分 的 特征 值 作为 权重 ,然后 求 加 权 均 值 。 结 果 见 图 20-28 
(C) 。 对 数据 库 的 天 值 进行 降序 排列 ， 发 现 上 海 、 北 京 、 江 苏 、 浙 江 、 广 东 等 依次 降 


图 20-28 


序 排列 。 但 因为 主 成 分 分 析 是 对 数据 进行 标准 化 后 的 分 析 , 依次 天 值得 分 在 -3 一 13 区 间 ， 
有 些 省 份 为 负 值 ， 不 太 好 看 ， 可 以 再 进行 了 分 数 转化 。 
(6) 了 分 数 转化 


计算 新 的 排名 天 =60+10x 天 ， 让 软件 利用 天 产生 一 组 0 一 100 分 的 数据 ， 其 中 的 60 
与 10 需要 大 家 调整 ， 最 高 分 一 般 不 可 超过 100 分 哦 。60 为 产生 新 的 数据 的 均值 ，10 为 
产生 新 的 数据 的 标准 差 的 近似 值 ， 根 据 数据 ， 现 实数 据 会 围绕 10 有 所 波动 。 


| 二 


1 北京 市 

3 10 江 范 省 

4 11 浙江 省 

5 19 广东 着 

6 2 无 津 市 

7 15 山东 省 

8 13 福建 省 1 

9 6 辽宁 省 6 

10 23 四 川 省 10 10 23 四 川 兰 
11 17 湖北 省 05 11 17 湖北 省 
12 18 湖南 着 04 12 18 湖南 省 
13 16 河南 省 0. 03 13 16 河南 省 
14 5 内 蒙古 自 说 区 -0. 30 14 5 内 蒙古 自治 区 
15 12 安徽 省 -0. 51 15 12 安徽 省 
16 3 河北 着 -0 人. 54 16 3 河北 省 
17 14 江西 省 -0. 68 17 14 江西 着 
18 29 重庆 市 -0. 69 18 22 和 直 庆 市 


图 20-29 ”综合 排名 
知识 拓展 


图 20-30 工分 数 转 化 


主 成 分 综合 评价 是 众多 综合 评价 方法 ， 如 层次 分 析 法 、 专 家 权重 法 等 中 的 一 种 ; 不 
同 分 析 方 法 最 终 得 到 的 结果 可 能 会 有 所 差异 ， 基 于 不 同 的 算法 ， 这 扣 完 全 可 以 理解 。 
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字 20.2 因子 分 析 


让 几 个 


是 因子 分 析 的 基础 ， 因 子 分 析 是 在 
蝇 拟 的 主 成 分 具有 专业 上 可 解释 的 意义 ， 


20.2.1 ”因子 分 析 思 想 


如 果 说 主 成 分 分 析 是 一 夫 一 妻 生 一 个 孩子 (2 个 变 1 个， 孩子 身上 拥有 父母 2 个 人 
的 信息 ) 的 话 , 那么 因子 分 析 就 是 后 天 对 孩子 的 培养 , 因为 刚 生 下 来 的 孩子 就 像 白 纸 一 样 
没有 社会 人 的 属性 ， 必 须 经 过 后 天 的 教育 和 培养 ， 才 能 成 为 社会 人 。 


20.2.2 ”因子 分 析 实 战 


案例 实战 

某 个 洗 发 水 生产 厂商， 想 调 查 消费 者 购买 洗 发 水 会 考虑 哪些 因素 ， 于 是 目 4 
表 对 30 名 消费 者 购买 洗 发 水 的 喜好 进行 
消费 者 的 购买 喜好 。 

(1) 分 析 一 降 维 一 因子 分 析 : 如 图 20-31 所 示 ， 将 6 个 研究 因素 放 入 变量 框 中 。 

(2) 摘 述 : 义 选 “系数 与 KMO”。 

(3) 提取 :; 先 默认 特征 值 大 于 1， 看 效果， 若 提 取信 息 量 不 高 ， 增 加 提取 的 主 成 

结果 解读 

(1) 主 成 分 分 析 条 件 ， KMO=-0.660>0.5，P=0.000<0.05， 适 合 进 行 主 成 分 降 维 分 析 ， 
图 20-32。 


主 成 分 分 析 的 基础 上 ,结果 空间 旋转 ， 


让 了 调 僵 
调查 ， 并 对 数据 data20.4.sav 进行 分 析 ， 探 索 


| 态 防治 二 点 油 膨 v5] 


上 让 半生 强 馆 [V6] 


[* 选 谋 变量 {EE : 


[at | 


KMO 和 巴特 利 竺 检验 
KMO 取样 适 切 性 量 数 


巴特 利 特 球形 度 检验 “近似 卡 方 TT1.314 


图 20-31 因子 分 析 20-32 KMO 检验 
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(2) 提取 的 主 成 分 : 由 图 20-33 可 以 及 现 按照 特征 值 关 于 1， 可 以 提取 2 个 主 成 分 ， 
可 解释 总 方 天 为 82.488%， 对 于 市 场 调查 类 高 于 80% 已 经 很 好 ， 于 是 就 决定 提取 2 个 主 
成 分 。 


总 方差 解释 
初始 特征 慎 提取 载荷 平方 和 旋转 载荷 平方 和 
成 分 “总计 ” 方 革 百分比 ” 奈 积 % 总 计 方 荐 百分比 ”不 积 % 总 计 方 苦 百分比 栗 可 区 
el J .el 中 .了 id 4 .Jel 中 .Doc 身 遇 .DU 4 .OU 
36.969 82.488 2.218 36.969 82.488 2.261 37.687 82.488 
5 or 
| 0.341 5 .688 95.536 
0.183 中.0D4 1 98.580 
6 0.085 1.420 100.000 


提取 方法 : 主 成 分 分 析 法 ， 


图 20-33 ”总 方差 解释 


因子 分 析 步 又 

因子 分 析 是 在 主 成 分 分 析 的 基础 上 进行 空间 旋转 , 最 常用 的 旋转 方法 为 最 大 方差 法 。 
大 家 重复 上 述 操作 ， 并 点 击 “ 旋 转 ”。 如 图 20-34 所 示 ， 选 择 “ 最 大 方差 法 ”， 并 勾 选 “ 载 
荷 图 ”。 

1. 因子 分 析 结 果 

(1) 旋转 后 成 分 解 ， 如 图 20-35 所 示 ， 可 知 因子 1 上 含有 预防 头皮 悄 、 防 治 头 皮 痒 
和 防治 头皮 油腻 ， 都 和 头皮 健康 有 关 ， 我 们 称 为 “健康 因子 ”; 因子 2 上 有 头发 柔顺 、 
头发 有 清新 香味 和 头发 球 逸 ， 都 和 头发 魅力 有 关 ， 我 们 称 为 “魅力 因 了 于 ”。 也 就 是 说 ， 
消费 者 购买 洗 发 水 主要 考虑 两 方面 ， 一 是 能 否 防治 头皮 疾病 , 二 是 能 否 让 头发 富有 魅力 。 


旋转 后 的 成 分 和 矩阵” 


四 四 次 蜡 要 大 法 (Q) 


国庆 大方 甘 法 (加 等 量 时 大 法 全 ) 预防 头皮 周 
中 直接 剩 芝 ;去 但 ) 外 县 优 斜 朗 法 (P) 促进 头发 柔 叮 
Delta: 0 Kappa |4 | 防治 头皮 阅 
头发 具有 清新 的 香味 
防治 涉 上 放 油 县 
最 大 收 襄 送 代 次 数 [X) : 25 | 提取 方法 ; 主 成 分 分 析 法 


旋转 方法 : 凯撒 正太 化 最 大 方差 法 。 
a. 旋转 在 3 次 选 代 后 已 收 全 。 


GEL 
图 20-34 因子 旋转 图 20-35 ”旋转 后 成 分 矩阵 


(2) 载 何 图 ， 从 图 20-36 可 以 友 现 6 个 因子 日 然 聚 成 2 类 ， 分 列 对 每 一 类 对 半 轴 和 
Y 了 轴 做 垩 线 ， 友 现 成、 所 、V 在 成 分 2 上 具有 较 大 载 傈 ， 夏 、 访 、 太 在 成 分 1 上 具有 较 


| 第 20 章 主 成 分 与 因子 分 析 | 323 


旋转 后 的 空间 中 的 组 件 图 


-1.0 -0.5 0.5 1.0 


0.0 
组 件 1 
图 20-36 载荷 图 

因子 分 析 小 结 

(1) 因子 载 向 一 般 小 于 0.3 称 为 低 载荷 ， 大 于 0.4 称 为 高 载荷 。 

(2) 因子 分 析 是 在 主 成 分 分 析 基 础 上 进行 进一步 旋转 ， 旋 转 的 目的 是 让 提取 出 的 因 
子 更 具有 专业 上 的 可 解释 性 。 

(3) 主 成 分 分 析 的 成 分 提取 方法 必须 是 主 成 分 法 ; 而 因子 分 析 的 因子 提取 分 析 方 法 
则 有 多 种 ， 因 此 因子 分 析 其 实 从 范围 上 包括 了 主 成 分 分 析 。 


本 章 主 要 讲述 一 些 仅 在 某 些 专业 领域 方才 应 用 的 方法 ,因为 常常 被 问 及 , 故 整理 此 篇 。 
松 哥 统 计 


| 
| 


2 


bh 


> 4 


> 


?> 
pa 


A 


第 21 音信 度 与 效 度 分 析 


我 们 在 科研 过 程 中 ， 经 常会 用 到 量 表 反 映 或 者 评价 被 调查 者 心理 、 态 度 等 主观 方面 
的 状态 。 正 如 我 们 用 体重 秤 去 称 量 一 个 人 的 体重 ,我 们 用 量 表 反 映 受 试 者 的 主观 感受 。 
体重 秤 都 是 经 过 计量 认证 的 ， 所 以 用 体重 秤 称 量 一 个 人 的 体重 才 准 确 。 可 是 我 们 用 量 表 
去 衡量 一 个 人 的 主观 感受 ， 这 个 量 表 是 否 也 需要 经 过 计量 认证 呢 ? 对 于 量 表 计量 认证 ， 
也 就 是 对 量 表 进行 评价 的 过 程 ， 只 有 评价 过 的 量 表 ， 用 其 进行 测量 结果 才 是 可 靠 的 。 

问卷 及 量 表 的 评价 包括 信 度 (reliability) 和 效 度 (validity) 两 个 方面 。 信 度 是 指 量 
表 测量 结果 的 可 靠 性 ， 可 重复 性 、 可 靠 性 越 高 的 量 表 ， 越 不 受 时 间 、 地 点 等 环境 的 影响 ， 
用 其 进行 检测 结果 较为 稳定 。 效 度 是 指 量 表 的 准确 性 ， 是 指 量 表 能 否 把 要 测量 的 目标 真 
正 地 检测 出 来 。 比 如 你 发 明了 一 个 专门 抓 田 鼠 的 装置 ， 如 果 确 实 能 抓 到 田鼠 ， 说 明 效 度 
好 ， 如 果 抓 到 的 是 蛇 ， 说 明 效 度 差 ， 要 抓 的 没 抓 到 ; 如 果 放 到 不 同 的 田地 不 同时 间 ， 均 
能 抓 到 田鼠 ， 那 就 说 明 信 和 度 高 。 对 于 量 表 而 言 信 和 度 和 效 上 度 都 要 好 才 行 ， 耕 非 要 分 个 高 低 ， 
那 就 是 效 度 比 信和 度 要 重要 点 ， 没 有 效 度 ， 信 和 度 再 高 也 是 白搭 ， 比 如 上 面 的 抓 刀 装置， 一 
只 田 女 都 没 抓 到 ， 抓 的 全 部 是 蛇 ， 就 像 坏 人 一 个 没 抓 到 ， 抓 的 全 是 好 人 ， 那 还 不 如 没有 
这 个 装置 呢 。 信 度 与 效 度 的 关系 见 图 21-1， 本 章 主要 介绍 如 何 进行 量 表 评价 。 


图 21-1 信和 度 与 效 度 
注 ; A 代表 信和 度 高 ， 效 度 低 : B 代表 信和 度 低 ， 效 度 低 ; C 代表 信和 度 高 ， 效 度 高 。 


字 21.1 信和 度 分 析 


21.1.1 ”信和 度 分 类 


1. 重 测 信和 度 (test-retest reliability) 
假定 短 时 间 内 一 批 对 象 的 状况 并 没有 改变 , 对 每 个 对 象 用 同一 个 问卷 先后 测验 两 次 ， 
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两 次 测验 得 分 的 相关 系数 就 称 为 重 测 信和 度 。 重 测 信 度 是 用 皮尔 逊 积 差 相关 系数 了 公式 计 
算 的 。 重 测 信 度 属于 稳定 系数 。 重 测 信和 度 法 特别 适用 于 事实 式 问 卷 ， 如 性 别 、 出 生年 月 
等 在 两 次 施 测 中 不 应 有 任何 差异 ， 大 多 数 被 调查 者 的 兴趣 、 爱 好 、 习 惯 等 在 短 时 间 内 也 
不 会 有 十 分 明显 的 变化 。 如 果 没 有 突 发 事件 导致 被 调查 者 的 态度 、 意 见 突变 ， 这 种 方法 
也 适用 于 态度 、 意 见 式 问卷 。 

由 于 重 测 信和 度 法 需要 对 同一 样本 试 测 两 次 ， 被 调查 者 容易 受到 各 种 事件 、 活 动 和 他 
人 的 影响 ， 而 且 间 隔 时 间 长 短 也 有 一 定 限制 ， 因 此 在 实施 中 有 一 定 困难 。 通 常 重 测 时 间 
跨度 以 2 ~ 4 周 为 宜 ， 太 短 会 受 记忆 的 影响 ， 太 长 义 受 环境 的 影响 。 

2. 复 本 信 度 法 (alternate form reliability) 

复 本 信 度 法 是 让 同一 组 被 调查 者 一 次 填 答 两 份 问卷 复 本 , 计算 两 个 复 本 的 相关 系数 。 
复 本 信 度 属于 等 值 系数 。 复 本 信和 度 法 要 求 两 个 复 本 除 表 述 模式 不 同 外 ， 在 内 容 、 格 式 、 
难度 和 对 应 题 项 的 提问 方 问 等 方面 要 完全 一 致 ， 但 在 实际 调查 中 ， 很 难 使 调查 问卷 达到 
这 种 要 求 , 因此 采用 这 种 方法 者 较 少 。 复 本 编制 不 容易 , 易 出 现 顺 序 效 应 , 受 练习 的 影响 ; 
复 本 信 度 只 能 反映 问卷 内 容 所 造成 的 误差 ， 无 法 反映 答卷 者 本 身 所 造成 的 误差 等 。 

3. 折 半 信和 度 法 〈split-halfreliability ) 

当 训 验 没 有 复 本 且 测 验 不 可 避免 地 党 到 时 间 的 影响 ， 只 适合 用 于 一 次 测验 时 ， 可 用 
分 半 信 和 度 。 分 半 的 方法 很 多 ， 一 般 是 将 奇数 题 和 偶数 题 各 作为 一 半 ， 而 非 前 后 分 半 ， 目 
的 是 避免 顺序 效应 。 分 半 信 和 度 也 叫 折 半 信和 度 , 其 计算 方法 是 将 问卷 的 题目 分 成 对 等 的 两 半 ， 
分 别 求 出 两 半 题 目的 总 分 ， 再 计算 两 部 分 总 分 的 相关 系数 。 使 用 分 半 信 度 时 要 注意 两 个 
问题 : 〈1) 问卷 题目 所 测 的 应 是 同一 种 特质 ，《〈2) 两 半 题 目 应 是 等 值 的 。 对 问卷 题目 
进行 分 半 会 造成 对 整个 问卷 信和 度 的 低估 ， 为 此 需要 对 分 半 信 度 进行 校正 ， 其 校正 公式 为 
斯 皮尔 曼 - 布衣 〈Spearman-Brown) 公式 ; Spearman-Brown 公式 要 求 两 个 分 半 表 的 信和 度 
和 方差 均 满足 齐 性 ; Guttman 分 半 信 度 ， 可 不 满足 上 述 要 求 。 这 种 方法 一 般 不 适用 于 事 
实 式 问卷 (如 年 龄 与 性 别 无 法 相 比 》， 常 用 于 态度 、 意 见 式 问卷 的 信和 度 分 析 。 在 问卷 调 
查 中 ， 态 度 测 量 最 常见 的 形式 是 5 级 李 克 特 (Likert) 量 表 。 

4. 库 得 - 理 查 森 信和 度 (Kuder - Richardson) 

库 德 - 理 查 森 信 和 度 运 用 于 计算 “对 或 错 ” 的 是 非 题 的 同 质 性 信和 度 ， 其 是 计算 所 有 可 
能 的 分 半 信 度 的 平均 数 。 该 信 度 系数 实际 应 用 较 少 。 

5. 殉 隆 巴赫 信和 度 系数 (cronbach’s a) 

cronbach’s a 系数 是 Cronbach 于 1951 年 创立 的 ， 用 于 评价 问卷 的 内 部 一 致 性 。cx 系 
数 取 值 在 0 一 1，x 系数 越 高 ， 信 度 越 高 ， 问 卷 的 内 部 一 致 性 越 好 。Cronbach's a 系数 不 
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仅 适 用 于 两 级 记分 的 问卷 ， 还 适用 于 多 级 计 分 的 问卷 。 殉 隆 巴 赫 信 和 度 系数 具有 如 下 特点 : 
CD ax 系 数 是 所 有 可 能 的 分 半 信 度 的 平均 值 ; 包 w 系数 是 估计 信 度 的 最 低 限 度 ;， 色 当 问 卷 
计 分 为 二 分 名 义 变量 时 ， 即 答案 为 0 或 1，a 系数 与 KR20 值 相 同 ， 即 库 德 - 理 查 森 信 度 
公式 是 克隆 巴赫 的 a 系数 的 一 个 特例 。 

一 般 地 ， 问 卷 的 a 系数 在 0.8 以 上 该 问卷 才 具 有 使 用 价值 。Cronbach’s a 值 皆 达 0.85 
以 上 ， 表 明 问 卷 信和 度 良 好 。a 系数 评价 的 是 量 表 中 各 题 项 得 分 间 的 一 致 性 ， 属 于 内 在 一 
致 性 系数 。 这 种 方法 适用 于 态度 、 意 见 式 问 卷 〈 量 表 ) 的 信 度 分 析 。 

一 份 信和 度 系 数 好 的 量 表 或 问卷 ， 最 好 在 0.80 以 上 ，0.70 ~ 0.80 还 算是 可 以 接受 的 范 
围 ， 分 量 表 最 好 在 0.70 以 上 ，0.60 ~ 0.70 可 以 接受 。 若 分 量 表 的 内 部 一 致 性 系数 在 0.60 
以 下 或 者 总 量 表 的 信和 度 系 数 在 0.80 以 下 ， 应 考虑 重新 修订 量 表 或 增删 题 项 。 

6. 评分 者 信和 度 (inter-scorer reliability) 

考察 评分 者 信 度 的 方法 为 ， 随 机 抽取 相当 份 数 的 问卷 ， 由 两 位 评分 者 按 记 分 规则 分 
别 给 分 ;然后 根据 每 份 问卷 的 分 数 计 算 相 关系 数 ， 即 可 得 到 评分 者 信和 度 。 评 分 者 信和 度 也 
可 以 是 一 位 评分 者 两 次 评分 的 相关 系数 。 如 果 是 多 个 评分 者 或 一 位 评分 者 两 次 以 上 的 评 
分 ， 可 采用 肯 德 尔 和 谐 系 数 和 开 appa 系数 。 肯 德尔 和 谐 系数 用 于 等 级 资料 ，Kappa 系数 
用 于 定性 资料 。 

上 述 6 种 信和 度 系 数 ， 以 克隆 巴赫 信和 度 系 数 应 用 最 广 ， 其 次 为 折 半 信和 度 ， 后 续 将 对 这 
两 个 信和 度 系 数 进 行 案例 讲解 。 


21.1.2 ”信和 度 优化 方法 


问卷 的 信和 度 越 高 ， 受 到 人 、 时 、 地 、 物 的 干扰 就 越 低 ， 其 所 能 反映 事实 或 让 人 相信 
的 程度 越 高 ， 因 此 在 问卷 实施 前 能 否 有 效 提高 信和 度 是 问卷 测验 成 败 的 关键 。 如 果 我 们 对 
制定 的 量 表 进行 预测 试 ， 然 后 进行 信和 度 分 析 时 发 现 量 表 的 信 度 较 低 ， 则 往往 可 以 通过 如 
下 的 方法 来 提高 信和 度 。 

(1) 适当 延长 问卷 的 长 度 。 

(2) 问卷 的 难度 适中 。 

(3) 问卷 的 内 容 上 尽量 同 质 。 

(4) 测验 的 时 间 要 充分 。 

(5) 测验 的 程序 要 统一 。 

案例 实战 

此 处 以 松 哥 做 过 的 一 个 医学 生 职 业 精 神 量 表 为 例 ， 该 量 表 包括 7 个 方面 ，29 道 题 目 ， 
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De 100 名 大 学 生 ， 数 据 见 data21.1.sav， 试 对 该 量 表 进行 信 度 分 析 。 
(1) 打开 数据 库 


(2) 可 靠 性 设置 


data21.1.sav。 分 析 一 标 度 一 可 靠 性 分 析 ， 如 图 21-2 所 示 。 
: 如 图 21-3 所 示 ， 将 29 个 题 项 放 入 题 项 框 ， 模 型 选择 “Alpha (〈 科 


隆 巴 赫 系 数 ) ”， 上 点击“ 统计 ”按钮 ， 弹 出 图 21-4。 


芝 析 佑 ) 二 销 岂 】 加 长 只 ) 实用 程序 册 ) | 窗口 [W) ， ， 


报告 中 ) 
指 干 闹 计 IE 
去 但) 

J 比较 平均 值 贡 ) 
一 技 北 怪 相 型 避 ) 
广 曙 站 性 权 型 区 ] 
误 癌 模型 包 ] 
相关 菠 ) 

固 冉 民 ) 

导 革 总 性 [Ol 

禄 经 网 培 () 

寺 类 正 ) 

降 准 :Di 

标 谋 邮 ] 

非 淹 者 术 验 作 |] 
时 间 序 融 预 吊 诺 ) 
里 存 号 析 怡 | 

考 重 响应 几 由 


图 21-2 ”信和 度 分 析 沫 单 图 21-3 可靠 性 分 析 
(3) 统计 设置 : 如 图 21-4 所 示 ， 重 点 勾 选 “删除 项 后 的 标 度 ”， 这 就 是 敏感 性 分 
析 指 标 。 俗 话 襄 “一 畦 老 眼 屎 坏 了 一 钢 绩 ”， 敏 感性 分 析 束 是 找到 那 肝 老 眼 尿 。 如 果 怠 
个 量 表 信和 度 不 高 ， 可 以 帮助 我 们 判定 到 底 是 哪 一 个 或 几 个 题 项 导致 的 ， 以 便 我 们 后 续 修 
订 别 除 。 点 击 “ 继 


剂 度 标签 : 


和 


闲 毕 标 度 (AL3CALWMIN.. 


继续 ”， 回 到 主 对 话 框 点 击 “ 确 定 ” 运 行 即 可 。 

主要 结果 解读 

(1) 科隆 巴赫 系数 ， 如 图 21-5 所 示 ， 上 部 为 案例 处 理 摘要 ， 告诉 我 们 有 无 缺失 人 
如 果 有 排除 变量 ， 建 议 去 查看 下 原始 数据 。 下 部 为 Alpha 系数 =0.874>0.8， 整 体 量 
可 徘 性 不 错 ， 接 近 0.9， 可 以 推广 。 


届 可 竺 性 分 析 : 统计 一 :一 个 案 然 理 摘要 


项 之 间 一 
| FS 加 个 案 有 效 100 100.0 
2 | 排除 a 0 0.0 


ANOWA 于 总 计 100 100.0 
同 平均 值 (M) 量 元) Fa 
回 方差 Q) 全 FE 术 下 a. 基于 过 程 中 所 有 变量 的 成 列 删 除 。 


回 协 启 竺 避 | | 


同 相等 性 避 ) 总 条 克 苦 卡 方 IHl 


四 堆 轩 村 T 平 方 (GQ) 器 图 革 可 加 性 检验 八 ) ee 
wi hts 
同 同 尖 相 活 闲 数 [T) 欢笑 统计 


很 型 [0] :昭和 同 混 窜 梧 | ”去 型 [ 中 -由 性 至 


二 信人 多): 85 中 榨 验 值 (): 站 


图 21-4 可靠 性 分 析 : 统计 设置 图 21-5 信和 度 分 析 结 条 
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(2) 敏感 性 分 析 , 在 图 21-6 中 , 重点 是 最 后 一 列 “删除 项 后 的 克隆 巴赫 Alpha 系数 ”。 
该 项 意思 是 删除 某 个 题 项 后 ， 剩 下 28 项 题目 的 克隆 巴赫 Alpha 系数 。 如 第 一 行 厂 对 应 
的 Alpha=0.870， 意 思 是 如 果 删 除 五 题 项 的 话 ， 剩 下 蕊 一 芒 共 28 题 的 克隆 巴赫 Alpha 
系数 为 0.870。 


项 总 计 统计 
删除 项 后 的 标 度 ”| 。 删除 项 后 的 标 度 。 | 修正 后 的 项 与 总 计 | 删除 项 后 的 克隆 巴赫 
平均 值 方差 相关 性 


RE EE OH SE PS RS 


小 


io 
A 1 


= 


2 


/ 127.33 19.949 0.483 0.869 


= 


VF 127 20 8 .279 0.406 0.870 
Vie 


上 127-32 81.008 0.502 0.869 
y 127.39 81.149 0.461 0.870 


NI 


Es 


127.23 82.724 0.372 0.872 
127.70 78.636 0.867 


V 121.29 82.309 0.409 0.871 


127.70 718.879 0.473 0.869 
三 127.49 19.869 0.321 0.868% 
2 127.64 718.7118 0.487 0.869 
/ 127.45 71.684 0.717 0.864 
127.79 71.602 0.548 0.867/ 

三 127.40 719.818 0.378 0.867 
广 127.78 19.3835 0.439 0.870 
2 127.43 81.237 0.443 0.870 


图 21-6 ”敏感 性 分 析 结 宁 


12 7 .30 80.212 0.488 0.869 
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如 果 删 除 某 项 后 ，Alpha 系数 增加 幅度 较 大 ， 说 明 整 个 量 表 Alpha 系数 较 低 是 由 该 指 
标 导 致 的 ， 建 议 对 该 指标 进行 修改 ， 如 果 题 目 量 足 够 的 情况 下 ， 也 可 以 删除 该 题 项 。 本 
例 从 上 到 下 ， 所 有 Alpha 相差 不 大 ， 说 明 题 目 设 置 较 好 ， 一 致 性 较 高 。 

重复 信 度 分 析 操 作 , 在 模型 下 拉 荣 单 中 选择 “ 折 半 ”, 如 图 21-7 所 示 ; 其 他 操作 不 变 ， 
点 击 “ 确 定 ” 运 行 。 主 要 结果 见 图 21-8。 

因为 我 们 总 共 29 道 题 ， 因 此 折 半 为 不 等 长 ， 故 图 21-8 结果 应 该 看 不 等 长 的 Spearman- 
Brown 系数 ， 为 0.862， 前 面 已 经 说 了 Spearman-Brown 系数 要 求 两 个 分 半 表 的 信和 度 和 方 
差 均 满足 齐 性 ;Guttman 分 半 信 度 ， 可 不 满足 上 述 要 求 ， 因 此 也 可 以 看 Guttman 分 半 系 
数 =0.860， 两 者 近乎 相等 。 


可 靠 性 统计 


克 降 巴赫 Apha 第 一 部 分 慎 0.707 
区 | | 项 数 ' 5 
scorestudent z a 党 一 部 分 什 0 846 
项 数 149 
总 项 数 29 
形态 之 加 的 相关 性 0.757 

TEXT oF 


格 特 曼 折 半 系数 | 

42. 项 为 : Vs LA Vs LA Ves Ves Vs Vhs 
Ve Vios Vhs Vi Vias Ves Vs 局 

b. 项 为 ; Vss Ves Vas Ves Vi Vi Vhs Vs 
Vs Vo Vas Vsss Va Van Vm. 


图 21-8 折 半 信和 度 结 果 


21.2.1 效 度 分 类 


效 度 (Validity) 即 有 效 性 ， 它 是 指 测量 工具 或 手段 能 够 准确 测 出 所 需 测 量 的 事物 的 
程度 。 效 度 分 为 三 种 类 型 。 

(1) 内 容 效 度 (Face Validity) 。 内 容 效 度 又 称 表 面 效 度 或 逻辑 效 度 ， 它 是 指 所 设 
计 的 题 项 能 否 代表 所 要 测量 的 内 容 或 主题 。 对 内 容 效 度 常 采用 逻辑 分 析 〈 专 家 法 ) 与 统 
计 分 析 相 结合 的 方法 进行 评价 。 

(2) 准则 效 度 (Criterion Validity) 。 准 则 效 度 又 称 为 效 标 效 度 或 预测 效 度 。 准 则 效 
度 分 析 是 根据 已 经 得 到 确定 的 茶 种 理论 ， 选 择 一 种 指标 或 测量 工具 作为 准则 〈 效 标 ) ， 
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分 析 问 卷 题 项 与 准则 的 联系 ， 藻 二 者 相关 显著 ， 或 者 问卷 题 项 对 准则 的 不 同 取 值 、 特 性 
表现 出 显著 差异 ,， 则 为 有 效 的 题 项 。 评价 准则 效 度 的 方法 是 相关 分 析 或 差异 显著 性 检验 。 
在 调查 问卷 的 效 度 分 析 中 ， 选 择 一 个 合适 的 准则 往往 十 分 困难 ， 使 这 种 方法 的 应 用 受到 
一 定 限制 。 

(3) 结构 效 度 〈(Construct Validity) 。 结 构 效 度 是 指 测量 结果 体现 出 来 的 某 种 结构 
与 测 值 之 间 的 对 应 程度 。 架 构 效 度 分 析 采 用 的 方法 是 因子 分 机 。 有 学 者 认为 ， 效 度 分 析 
最 理想 的 方法 是 利用 因子 分 析 测 量 表 或 整个 问卷 的 架构 效 度 。 因 子 分 析 的 主要 功能 是 从 
量 表 全 部 变量 〈 题 项 ) 中 提取 一 些 公 因子 ， 各 公 因 子 分 别 与 某 一 群 特定 变量 高 度 关 联 ， 
这 些 公 因 子 即 代表 了 量 表 的 基本 架构 。 透 过 因子 分 析 可 以 考查 问卷 是 否 能 够 测量 出 研究 
者 设计 问卷 时 假设 的 某 种 架构 。 

在 因子 分 析 的 结果 中 ， 用 于 评价 架构 效 度 的 主要 指标 有 累积 贡献 率 、 共 同 度 和 因子 
负荷 。 累 积 贡 献 率 反 映 公 因子 对 量 表 或 问卷 的 累积 有 效 程度 ， 共 同 度 反 映 由 公 因 子 解释 
原 变 量 的 有 效 程度 ， 因 子 负 荷 有 反映 原 变量 与 某 个 公 因 子 的 相关 程度 。 为 了 提升 调查 问卷 
的 质量 ， 进 而 提升 整个 研究 的 价值 ， 问 卷 的 信和 度 和 效 度 分 析 绝 非 效 疣 蛇 足 ， 而 是 研究 过 
程 中 必 不 可 少 的 重要 环节 。 

效 度 分 析 有 多 种 方法 ， 其 测量 结果 反映 效 度 的 不 同方 面 。 一 般 来 说 ， 学 科 测 验 主要 
看 内 容 效 度 ， 心 理 测验 主要 看 结构 效 度 。 


20.2.2” 效 度 分 析 实 战 


案例 实战 

仍然 以 上 述 医 学 生 职 业 精 神 量 表 为 例 ， 该 量 表 包括 7 个 方面 ，29 道 题目 ， 测 试 了 不 
同 专业 的 100 名 大 学 生 ， 数 据 见 data21.1.sav， 试 对 该 量 表 进行 内 容 效 度 分 析 。 

二 实战 步骤 

打开 数据 data21.1， 分 析 一 相关 一 双 变 量 ， 如 
图 21-9 所 示 ， 将 蕊 一, 及 总 分 放 入 变量 框 中 ， 选 
择 “皮尔 逊 ” (Pearson) 相关 系数 ， 点 击 “ 确 定 ” 
= 人 即 可 。 
IE :机 人 
因为 本 例题 型 较 多 ， 做 出 的 相关 和 矩阵 较 大 ， 因 
此 图 21-10 展示 的 为 也 一 与 总 分 的 相关 性 。 如 果 
量 表 的 内 容 效 度 较 高 ， 则 每 题 得 分 与 总 得 分 的 相关 
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性 均 应 该 较 高 ， 判 定 标准 为 />0.4， 本 例 太一 态 中 ， 肥 与 总 分 的 相关 性 一 0.362<0.4， 因 
此 建议 考虑 删除 记 。 


相 兴 性 
V1 Wa V3 WV V5 scorestudent 
WA 皮尔 进 相 壬 忻 0.091 0.162 0.153 0.279 0D.494 
好 著 性 【 观 尾 ) 0.370 D.106 0.128 0.005 0.000 
个 案 数 100 100 100 100 100 100 
2 应 尔 进 相 湛 性 0.091 1 0.383 D153 D0.304 D0.#489 
显著 性 【 观 尾 ) 0.370 0.000 0.130 0.002 0.000 
个 案 此 100 100 100 100 100 100 
Wa 皮尔 馆 相 估 尾 0162 0383 1 03247 03256 0419 
显著 性 【 双 尾 ) 0.106 0.000 0.015 0.010 0.000 
个 村 蒜 100 100 100 100 100 100 
W 吉尔 进 相 估 尾 0153 0153 024 1 0036 0.367 
显著 性 【 观 尾 ) 0.128 0.130 0.015 0.723 0.000 
个 案 数 100 100 100 100 100 100 
Ws 上 讶 尔 进 相 估 性 03279 0304” 0256 0036 1 0533 
显著 性 【 观 尾 ) 0.005 0.002 0.010 0.723 0.000 
十 由 7 [站 门口 门 门 [7 100 
1 
100 


“在 0.05 级别 1 驱 尾 ): 相 甘 性 显 普 : 


图 21-10 相关 性 分 析 


案例 实 成 2 

东 研 究 者 在 一 项 中 学 知识 管理 与 学 校 效 能 关系 的 研究 中 , 目 编 “学校 知识 营 理 量 表 ”， 
此 表 共 有 19 题 ， 为 探究 量 表 的 可 信 效 度 及 题 项 的 适 切 性 ， 随 机 抽取 200 人 进行 测试 ， 求 
此 19 题 的 结构 效 度 如 何 ? 〈 本 案例 数据 来 源 坟 明 隆 ，《 问 卷 统计 分 析 实 务 》) 量 表 题 项 
设置 见 表 1， 该 量 表 围绕 知识 创新 1 一 6 题 ， 知 识 分 享 7 一 13 题 和 知识 获取 14 一 19 题 进 
行 编 排 ， 预 调查 数据 见 data21.2， 试 对 结构 效 度 进行 分 析 。 


是 
本 校 经 常 鼓励 教师 创新 教学 或 工作 创新 
本 校 教师 会 积极 寻求 班级 经 营 上 的 创新 
教师 会 积极 地 在 其 负责 的 行政 工作 上 创新 展现 


本 校 教师 会 应 用 研习 班 心得 于 教育 质量 的 提升 


表 21-1 学 校 知识 管理 量 表 


本 校 会 激励 教师 以 创新 理念 提升 学 生 学 习 成 效 

6 | 本校 鼓 励 教师 以 创新 有 效 方法 激励 学 生 学 习 
校长 会 积极 鼓励 同人 ， 分 享 研习 吸收 的 新 知 能 

8 | 本 校 教师 会 将 班级 经 营 的 有 效 策略 ， 与 其 他 教师 分 享 
本 校 教师 会 在 相关 会 议 中 提供 意见 供 其 他 教师 分 享 


10 | 本校 
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到 完全 不 | 多 数 不 | 半数 不 | 多 数 二 
符合 符合 符合 符合 

下 RE 分 享 其 教学 经 验 站 

本 校 同 仁 会 于 朝 会 上 分 享 其 研习 的 心得 与 知 能 

13 | 本 校 教师 会 于 同人 会 议 中 分 享 其 处 理学 生 问题 的 策略 


学 校 鼓励 同人 参 访 标杆 学 校 以 获取 教学 及 行政 知 能 


学 校 会 鼓励 教师 通过 教学 观摩 ， 以 获取 专业 知 能 

学 校 积 极 鼓励 教师 参与 研习 活动 ， 以 获取 专业 知 能 

学 校 鼓励 教师 通过 教师 社 群 活动 ， 以 获取 专业 知 能 | 
18 | 学校 鼓励 教师 通过 数位 化 数据 来 获取 新 知识 | | | | | 
19 | 学 校 会 影印 相关 教育 新 知 给 教师 ， 以 增进 教师 技能 | | | | | 


打开 data21.2， 分 析 一 降 维 一 因子 分 机， 弹出 图 21-11， 将 所 有 变量 放 入 变量 框 中 ， 
点 击 “ 描 述 ”, 图 21-12 中 多 选 “ 系 数 ” 和 “KMO 和 巴特 利 特 球 形 度 检验 ”; 在 图 21-13 中 ， 
选择 基于 特征 值 大 于 1; 图 21-14 中 选择 “最 大 方差 法 ”和 “旋转 后 的 解 ”。 


回 单 变 量 措 述 (U) 
图 初 姐 解 由 


Ca 尘 择 支 县 (C): 
国 广 ”一 


| 全 出 .| 


图 21-11 因子 分 析 


[as Res | 
邯 析 种 ii 
态 租用 性 后 陡 (R) 未 诈 转 因子 牌 企 ) 
总 协 方差 敌阵 他 加 玉石 图 从 ) 


夯 对 于 特征 值 人 ) 2 
ee 


吕 
于 机 的 因 于 数 ( : 3 


茹 太 收 下 迭代 次数 [0) : 
Ee 重 栖 fc 让 | 取消 || 二 


图 21-13 ”因子 分 析 : 提取 图 21-14 因子 : 旋转 
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主要 结果 : 
在 图 21-15 中 ，KMO=0.855>0.5， 样 本 量 足 够 ， 球 形 度 检验 ，P=0.000<0.05， 符 合 球 
形 度 检验 。 结 合 两 项 指标 ， 本 例 适 合 进行 因子 分 析 。 


总 方 菠 和 解释 
初始 特征 什 提取 载荷 平方 和 旋转 载荷 平方 和 
品 总 计 条 董 百 分 比 累积 %% 总 计 方 逆 百分比 。 累积 % 总 计 且 苹 目 分 比 累积 % 


1 24159 24159 
2 21.012 45.171 
3 18.123 63.294 
4 5.960 69.253 
5 0.867 4670 73923 
6 0.824 4.335 78.258 
7 0.707 3.721 81.978 
8 0.548 2.887 84.865 
9 0.486 2.556 87.421 
10 0.464 2.441 89.862 
11 0.431 2.266 92.128 
12 0.339 1.785 93.913 
13 0.321 1.692 95.605 
14 0.302 1.587 97.192 
KMO 各 竺 利 竺 检验 15 0.200 1.054 98.246 
“KMO 取 样 话 切 性 最 数 : 0855 16 0.172 0.908 99.154 
巴特 利 特 球形 度 检验 。 近似 卡 方 。 3079.151 于 EE oe 
ed 18 0.053 0.281 99.918 
目 由 医 171 19 0.016 0.082 100.000 
显 者 性 Se 提取 方法 : 主 成 分 分 析 法 : 


图 21-15 KMO 检验 图 21-16 总 方差 解释 


图 21-17 旋转 后 成 分 窍 阵 ， 结果 发 现 19 道 题目 在 结构 上 分 成 4 类 ,其 中 cv 目 成 1 类 ， 
因此 cj, 应 该 删除 ， 删除 cj, 之 后 ， 我 们 重复 刚才 的 操作 ， 再 次 获得 总 解释 方 着 图 21-18 
和 旋转 后 成 分 矩阵 图 21-19。 结 果 可 见 旋转 后 成 分 矩阵 正好 落 在 3 个 成 分 之 上 ， 并 且 每 个 
成 分 里 面 的 题目 设置 符合 设置 预期 。 


旋转 后 的 成 分 矩阵 
成 分 
2 3 二 
Cg 0.075 0.001 
Cy 0.077 0.013 
Ce 0.179 0.092 
Se -0D.01B 0.074 
Cl D0.212 口 .1 1 
心 0.127 -0.147 
Cs 0.116 -0.037 
Cy 0.049 
Cg 0.046 
Cle -0.086 
Cl -0.101 
人 -0.395 
Cs 0.101 0.076 
CG, 0.093 0.094 
GC 0.009 -0.053 
Ce 0.058 - 间 .11944 
5 0.063 0.394 
Ce 0.157 -0.092 
全 > 0.091 -0.082 -6.003 


提取 方法 : 主 成 分 分 析 法 。 
施 乱 方法 ; 部 搬 正 志 化 最 大 方差 法 。 


9. 旋转 在 5 次 不 代 后 已 收效 


图 21-17 旋转 后 成 分 矩阵 
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外 


| 


一 
BB = i hh 一 


提取 方法 : 


说 始 特 征 值 


0.931 
0.834 
0.708 
0 .597 
D0.493 
0.46d 
0.432 
0.340 
0 .322 
0.302 
0.205 
0.173 
0.092 
0.054 
0.016 
主 成 分 分 析 法 。 


总 计 片 差 百 分 比 


5.173 
4.627 
3.931 
3.318 
2.740 
2.580 
2.499 
1.888 
1.787 
1.676 
1.139 
0.960 
0.510 
0.300 
0.087 


总 方 症 解释 


提取 载荷 平方 和 
累积 % 村 计 片 差 百 分 比 ”累积 % 


7.208 40.043 40.043 
2.830 15.722 55.766 
2.001 11.119 66.985 


2.058 
6.684 
80.616 
B3.934 
BE6.674 
B89.254 
91.654 
93.541 
95.328 
97.008 
98.143 
99.103 
99.613 
99.913 
100.000 


图 21-18 剔除 Cu 后 总 方差 外 


总 计 
4.488 


4.104 
3.447 


释 


旋转 后 的 成 分 矩阵 = 
旋转 载荷 平方 和 
方 车 百分比 棍 祝 区 
24.932 Cs 
22.802 G 
19.151 


提取 方法 : 主 成 分 分 析 法 。 
旋转 方法 : 凯撒 正 坟 化 晤 天 方 羡 法 。 


a. 旋转 在 5 次 选 代 后 已 收 化 。 


图 21-19 剔除 Cu 后 旋转 成 分 定 阵 


> | 
、” TI > 


> 2 J- 第 22 草 ROC 曲线 


pS 


学 习 ROC 曲线 应 该 具有 诊断 试验 的 基础 ，ROC 曲线 是 根据 一 系列 不 同 的 二 分 类 方 
却 《〈 分 界 值 或 决定 国 ) ， 以 真 阳性 率 灵敏度) 为 纵 坐 标 ， 假 阳性 率 (1- 特异 度 ) 为 横 
坐标 绘制 的 曲线 。 ROC 曲线 主要 用 于 际 为 连续 资料 (老大) ，Y 为 二 分 类 资料 ( 老 三 ) 时 ， 
如 何 确 定 老 大 的 数值 大 于 或 者 小 于 多 少时 ， 老 三 阳性 事件 发 生 。 


之 22.1 诊断 试验 与 ROC 概述 


诊断 是 指 应 用 各 种 检查 手段 对 病人 进行 检查 ， 以 确定 和 排除 疾病 的 试验 方法 。 广 义 
的 诊断 试验 包括 各 种 实验 室 检 查 、 仪 器 诊断 以 及 病史 、 体 检 所 获得 的 各 种 临床 资料 。 讲 
的 简单 点 ， 就 是 如 果 你 是 一 个 医生 ， 来 了 个 身体 不 舒服 的 人 ， 你 用 某 种 检查 方法 ， 确 定 
其 到 底 有 没有 病 。 

涂 够 白 分 之 白 正 确诊 断 某 种 疾病 的 方法 ， 我 们 就 把 它 叫 作 “ 金 标准 ”， 如 肿瘤 的 病 
理 切 片 ， 结 石 病人 的 外 科 手 术 所 见 等 。 金 标准 的 诊断 方法 往往 成 本 高 郧 、 费 时 、 费 力 ， 
损伤 大 ， 不 便于 快速 实施 ， 因 此 ， 我 们 就 想 寻 找 人 简单 易 行 的 检测 方法 进行 蔡 代 ， 如 义 射 
线 、 超 声波 、CT 扫描 、 磁 共振 、 抽 血 检 查 等 。 然 而 蔡 代 的 检测 方法 肯定 要 与 金 标 准 进行 
比较 ， 达 到 一 定 的 要 求 才 能 用 ， 而 这 种 比较 就 叫 作 诊断 试验 的 评价 ， 诊 断 试验 评价 表格 
如 表 22-1 所 示 。 


表 22-1 诊断 试验 评价 表 


诊断 试验 的 评价 指标 包括 真实 性 、 可 靠 性 与 效益 评价 ， 真 实 性 评价 常用 指标 如 下 ， 
其 中 的 灵敏 度 与 特异 度 将 会 与 ROC 有 关 。 
灵敏 度 : Se=a/ (atc) x100% 
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假 阴 性 率 =c/ (atc) x100% 

特异 度 : Sp=d/ (b+4d) x100% 

假 阳性 率 : =b/ (b+d)》x100% 

约 登 指 数 : 灵敏 度 + 特异 度 -1 

案例 实战 

70 例 糖 尿 病 患 者 及 510 例 正常 人 在 口服 葡萄 糖 2 小 时 后 进行 血糖 试验 ， 若 以 血糖 三 
7.2mmol/L 为 阳性 标准 ， 其 检测 结果 如 表 22-2 所 示 ， 用 上 述 指标 对 此 试验 的 真实 性 进行 
评价 。 

表 22-2 诊断 试验 结果 
试验 金 标 准 


( 血糖 测定 ) ER A 
阳性 
(三 7.2mmolL) 


(<7.2mmol/L) ( 假 阴 性 c) ( 真 阴 性 q) 
一 

灵敏 度 =a/ (atc) x100% 

灵敏 度 =62/ (62+8) x100%=88.57% 

确诊 的 糖尿 病 病 人 中 血糖 试验 阳性 或 异常 人 数 所 占 的 比例 为 88.57% 

特异 度 =4d/ (btqd) x100% 

特异 度 =348/ (162 + 348 ) x100%=68.24% 

正常 人 中 血糖 试验 阴性 或 正常 人 数 所 占 的 比例 为 68.24% 

假 了 明 性 率 =c/ (atc) x100% 

假 阴 性 率 =8/ (62 + 8 ) x100%=11.43% 

确诊 的 糖尿 病 病 人 中 血糖 试验 为 阴性 或 正常 的 人 数 所 占 的 比例 为 11.43% 

假 阳性 率 =b/ (2p+d) x100% 

假 阳性 率 =162/ (162 + 348 ) x100%=31.76% 

正常 人 中 血糖 试验 阳性 或 异常 的 人 数 所 占 的 比例 为 31.76% 

约 登 指数 =88.57%6+68.249%6-1=0.57 


大 家 试想 一 下 ， 我 们 要 做 诊断 试验 的 评价 ， 则 我 们 需要 用 检测 方法 将 竺 检测 的 病人 
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分 为 阳性 与 阴性 两 类 人 群 ， 并 与 金 标准 进行 比较 ， 构 成 诊断 试验 评价 的 四 格 表 ， 方 才 可 
以 对 诊断 试验 的 能 力 进行 评价 。 上 例 中 ，70 例 糖 尿 病 病人 和 510 例 正 常人 ， 进 行 餐 后 血 
糖 检测 ， 选 择 血糖 7.2mmolL 为 标准 ， 将 竺 检测 的 人 群 分 为 阳性 组 和 阴性 组 ， 并 与 金 
标准 构成 诊断 评价 四 格 表 进行 评价 。 但 是 大 家 有 没有 想 过 ， 该 人 群 血 糖 检测 后 ， 血 糖 值 
是 在 一 个 连续 的 范围 里 ， 作 者 为 什么 选择 血糖 三 7.2mmolL 为 阳性 标准 ， 和 赁 什么 选择 这 
个 诊断 界 值 呢 ? 

图 22-1 为 正常 人 与 糖尿 病人 的 餐 后 2 小 时 血糖 分 布 ， 我 们 发 现 正常 人 与 病人 的 血糖 
分 布 相互 间 存 在 交叉 ， 并 没有 完全 制 裂 ， 如 果 完 全 制 裂 开 来 ， 那 么 血糖 值 在 制 裂 地 带 选 
诊断 界 值 ， 就 能 百分之百 将 正常 人 与 病人 正确 分 开 。 然 而 当 存 在 交叉 的 时 候 ， 不 管 你 如 
何 选择 诊断 界 值 ， 都 会 出 现 假 阳性 或 者 假 阴 性 。 那 我 们 到 辰 该 如 何 选择 这 么 一 个 诊断 界 
值 呢 ? 这 就 是 ROC 曲线 要 帮助 我 们 解决 的 问题 。 

ROC 的 思想 就 是 ， 在 连续 性 的 检测 指标 〈 等 级 资料 同样 适用 ) 中 ， 以 各 种 可 能 的 界 
值 作为 诊断 界 值 ， 然 后 让 软件 去 计算 每 一 个 诊断 界 值 所 对 应 的 灵敏 度 与 特异 度 ， 并 以 灵 
敏 度 为 了 轴 ，1- 特异 度 作 为 工 轴 ， 制 作 一 条 连续 性 的 曲线 ， 即 ROC 曲线 ， 如 图 22-2 所 
示 , 此 曲线 最 左上 角 的 界 值 即 是 灵敏 度 和 特异 度 最 大 的 界 值 ， 应 该 作为 最 佳 的 诊断 界 值 。 
同时 不 同 诊断 指标 的 ROC 曲线 下 的 面积 (area under curve，AUC) 不 同 ， 如 图 22-3 所 示 ， 
AUC 越 大 ， 说 明 该 指标 的 诊断 能 力 越 强 ， 所 以 AUC 可 以 用 于 不 同 诊断 指标 之 间 诊 断 效 
果 的 比较 。 


100% 一 
80% 
正 半 人 
诊断 界 值 tw 60% 
\ 假 阳 性 率 咬 on | 


20% 


0% 

~ 0% 20% 40% 60% 80% 100% 
四 1- 特 异 度 

图 22-1 正常 人 与 糖尿 病人 的 餐 后 2 小 时 血糖 分 布 图 22-2 ”ROC 曲线 
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100 


80 


sensitivity (%) 


0 10 20 30 40 50 60 70 
1-specificity (%) 


图 22-3 多 指标 ROC 曲线 
AUC 取 值 范围 为 0 三 4UC 三 1， 在 AUC 大 于 0.5 的 情况 下 ，4 越 接 近 1 说 明 诊 断 
的 准确 性 越 高 ， 当 4UC=0.5 时 说 明 诊断 完全 不 起 作用 ; 4UC<0.5， 不 符合 实际 情况 。 一 
般 认为 0.5<4UC 和 0.7 表示 诊断 价值 较 低 ，0.7<4UC 三 0.9 表示 诊断 价值 中 等 ，4UC>0.9 
表示 诊断 价值 高 。 


案例 实战 


某 天 松 哥 突 发 奇想 ， 利 用 590 名 大 学 生 的 性 别 、 身 高 、 体 重 、 胸 围 和 肺 呼 量 资料 ， 
想 看 看 能 否 用 身高 、 体 重 、 胸 围 和 肺 呼 量 来 诊断 大 学 生 的 性 别 〈 男 =1=abnormal， 女 
=2=normal) ， 人 性别 虽然 不 是 疾病 〈 有 病 与 无 病 ) ， 但 思想 一 致 ， 关 键 是 这 个 案例 可 以 进 
行 多 种 后 续 的 演示 ， 数 据 见 data22.1.sav。 基 于 此 提出 如 下 3 个 问题 。 

(1) 用 身高 诊断 性 别 的 AUC 是 多 少 ? 身高 诊断 性 别 界 值 如 何 确定 ? 

(2) 身高 、 体 重 、 胸 围 以 及 肺 呼 量 4 个 指标 哪个 诊断 的 准确 性 较 好 ? 

(3) 能 否 根据 上 述 4 个 指标 构建 一 个 更 好 的 综合 指标 ? 


22.2.1 问题 (1 


实战 步 又 
打开 数据 库 , 分 析 -ROC 曲线 , 如 图 22-4 所 示 , 将 “身高 ” 放 入 “检验 变量 ” 框 ,“ 组 别 ” 
放 入 “状态 变量 ”， 并 且 输入 状态 变量 的 变量 值 ， 本 例 为 1。 选 项 按钮 无 须 设置 。 点 击 “ 确 
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定 ” 即 可 。 注 意 状态 值 一 定 设置 


置 正确 ， 人 否则 ROC 曲线 可 能 会 倒置 ， 甚 至 4UC 小 于 0.5。 
下 显 示 选 项 中 ，4 个 选项 部 选 。 


ROC 曲线 
| = 
so” 悖 二 


带 对 角 参 考 城 员 1 
标 ; 兮 误差 和 置信 区 问 避 | 
民 C 曲 并 的 半 标 点 


图 22-4 ROC 曲线 
结果 解读 


22-5 为 ROC 曲线 结果 ， 图 中 可 见 ，ROC 曲线 下 面积 比较 饱满 ， 目 测 正确 效果 应 
该 不 错 。 其 中 对 角 线 针对 的 面积 为 0.5, 我 们 做 出 的 ROC 远 远 高 于 对 角 线 , 说 明 效果 不 错 。 

22-6 为 曲线 下 面积 (AUC) ， 本 例 4CVC=0.936， 说 明 本 例 采 用 吴 高 
效能 将 达到 93.6%，95% 可 信 区 间 为 0.917 一 0.955。 


上 
10 


来 诊断 性 别 的 


0.4 


曲线 下 方 的 区 域 
0.2 


检验 结果 变量 身 栅 


0.0 
0.0 0.2 0.4 


之 间 的 旷 定 值 。 统计 可 能 有 俩 差 。 
0.6 0.8 1.0 a _ 按 非 参 旷 候 定 
1- 特 异性 b_. 原 假设 : 真 区 域 = 0.5 
图 22-5 ROC 曲线 结果 


图 22-6 ”曲线 下 面积 
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如 何 确定 身高 的 诊断 界 值 

ROC 制定 诊断 界 值 , 采用 约 登 指数 (Yuden Index, YI) 最 大 法 , 7 到 灵敏 度 + 特 异 度 -1。 
SPSS 没有 直接 帮 有 我们 算出 诊断 界 值 ， 在 结果 图 22-7 中 ， 第 一 列 为 具体 的 身高 值 ， 第 二 
列 和 第 三 列 为 该 身高 值 对 应 的 灵敏 度 和 1- 特异 度 。 因 此 ， 我 们 只 需要 产生 一 个 新 的 变量 
并， 让 其 等 于 第 二 列 减 去 第 三 列 ， 即 灵敏 度 -(1- 特异 度 ) = 灵敏度 + 特异 度 -1。 我 们 
双击 激活 图 22-7, 将 数据 复制 , 重新 构建 到 一 个 SPSS 数据 集中 , 利用 compute (计算 功能 ) 
计算 出 这 。 然后 对 玖 进行 降序 排列 即 可 找到 最 大 的 到 ,与 其 对 应 的 身高 值 即 为 诊断 界 值 。 

上 述 操作 过 于 简单 ， 本 处 直接 给 出 最 终结 果 ， 见 图 22-8， 可 以 发 现 最 大 约 登 指数 
7=-0.75， 对 应 的 身高 值 为 164.23Scm， 即 以 身高 二 164.25cm 作为 诊断 男 大 学 生 的 标准 ， 
其 到 为 0.75。 

曲线 的 坐标 


术 验 结果 变量 : 身高 


大 于 或 等 于 此 


值 时 为 正 " 敏感 度 。 1 -特异 性 
144.000 1.000 1.000 
146.000 1.000 0.990 
147.500 1.000 0.983 
148.500 1.000 0.965 
149.500 1.000 0.962 
150.500 1.000 0.923 
151.250 1 .000 0.895 
151.750 1.000 0.892 训 件 正 ) 。 转 加 三】 ”查看 MJ 。 其 据 人 转换 四 芳 析 辐 。 痢 销 轴 | 图 脱 虐 ) ”实用 得 序 (U] 扩展 [WJ] 天 
152.500 0.997 0.868 全 癌 品 cs “二 二 尖 轩 此 二 国 ， 
153.250 0.997 0.815 5 
153.750 0.997 0.812 过 与 ”灵敏度 | 特 民 度 1 | 
和 i 站 | 1 164. 250 0. 851 . 105 0.75 
站 nd ny | 2 164.750 0.848 0. 105 0.74 
ee tate 人 | 3 163. 500 0. 875 0. 153 0.72 

4 165. 500 0. 795 0. 080 0. 72 

Samay ea Wb 5 162. 500 0.901 0. 195 0.71 
158.500 0.970 0.512 6 | 166.500 0.752 0. 052 0. 70 
图 22-7 曲线 坐标 图 22-8 ”诊断 界 值 的 确定 


注意 图 22-8 中 变量 特异 度 1 代表 的 是 1- 特异 度 ， 因 为 1- 特异 度 不 符合 SPSS 变量 
命名 规范 。 


22.2.2 ”问题 (2 ) ROC 实 战 

打开 上 述 数 据 库 ， 分 析 一 ROC 曲线 ， 如 图 22-9 所 示 ， 将 身高 、 体 重 、 胸 围 和 肺 呼 量 
全 部 放 入 检验 变量 框 中 ; 组 别 放 入 状态 变量 ， 同 时 设 定 状 态 值 ， 显 示 框 中 4 个 选项 全 选 。 
点 击 “ 确 定 ” 运 行 结 果 。 
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| 只 ROC 曲 绑 


‖ 贺 ROC 曲线 (U) 
带 对 角 和 参考 线 (W) 
标准 误 荐 和 置信 人 区间 丛 ) 
| ROC 曲 夏 的 坐标 点 


图 22-9 ”ROC 曲线 


结果 解读 
图 22-10 为 多 指标 ROC 曲线 结果 ， 结 果 显 示 对 诊断 性 别 而 言 ， 由 好 到 兰 的 指标 依次 
为 肺 呼 量 、 吴 局、 体重 和 胶 围 。 


1.0 


0.2 


0.0 0.2 0.4 0.6 0.8 1.0 
1- 特 异性 
图 22-10 多 指标 ROC 曲线 
图 中 4、B、C、D、E 分 别 代表 肺 呼 量 、 身 高 、 体 重 、 胸 围 和 参考 线 。 图 22-11 为 各 
指标 的 4CC， 根 据 其 数值 大 小 ， 也 可 以 初步 判定 各 指标 诊断 价 人 的 大 小 ， 但 是 SPSS 不 
能 直接 进行 不 同 指标 的 AUC 统计 检验 是 否 存在 差异 ， 我 们 只 能 通过 后 面 的 9$% 可 信 区 
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间 进 行 判定 ， 可 信 区 间 没有 重复 ， 则 可 以 认为 两 个 指标 之 间 差异 存在 统计 学 意义 。 如 
肺 呼 量 为 0.937 ~ 0.969， 而 胸围 为 0.671 ~ 0.752， 两 者 之 间 没 有 交叉 ， 因 此 可 以 认为 
肺 呼 量 的 AUC 要 高 于 胸围 。 如 果 要 直接 拿 到 两 者 比较 的 了 值 ， 大 家 可 以 用 Medcalc 软 
件 实现 。 


曲 浅 下 方 的 区 感 


渐 近 959% 置信 区 间 
标准 误差 ” ” 浙 近 显著 性 " 六 下限” 上 


65 百 来 变量 耳 癌 , 体重 , 条 围 , 肺 呼 量 至 少 有 一 个 在 正 实际 状态 胃 写 信守 了 和 于 
组 之 间 的 晨 定 值 : 统计 可 能 有 性差 


a. 按 非 倒数 假定 


b. 原 和 假设 : 真 区 域 = 0.5 
图 22-11 曲线 下 面积 


AUC 曲线 下 面积 比较 

需要 注意 的 是 ，AUC 相互 比较 存在 两 种 情况 ， 一 种 为 多 种 方法 对 同一 群体 进行 检测 
的 结果 (配对 法 ) ; 还 有 一 种 为 多 种 方法 ,每 种 方法 检测 的 群体 是 不 同 的 群体 (成 组 法 ) 。 
配对 法 采用 Delong 法 ， 计 算 方 法 较为 复杂 ，Medcalc 软件 提供 的 就 是 Delong 法 。 

(1) 成 组 法 利用 的 就 是 Z 检 验 ，2Z= (41-4A,) /sqrt[se (41) + (se (A,) ]， 如 果 
2Z>1.96， 则 P<0.05， 两 种 方法 诊断 准确 性 差异 有 统计 学 意义 。 如 用 CT 入 线 分 别 诊断 纵 甩 
淋巴 结 肿 大 ，CT 的 曲线 下 面积 4.=0942，se (41) =0.016, 义 线 的 40.874，se (4,) =0.025， 
则 代入 公式 : 

Z= (0.942-0.874) /sqrt (0.016 +0.025”) =2.259>1.96，P<0.05， 因 此 CT 和 和 线 诊 断 
纵 甩 淋 巴结 肿 大 准确 度 的 差别 有 统计 学 意义 ，CT 要 优 于 和 线 。 

(2) Delong 法 : 本 例 采 用 Medcalc 实现 。Medcalc 软件 可 以 关注 微 信 公众 号 : 
data973， 获 取 试 用 版 。 打 开 Medcalc 软件 ， 如 图 22-12 所 示 ， 选 择 左 上 角 打 开 文 件 夹 一 
选择 SPSS 文件 “.Sav” 格 式 ， 找 到 我 们 的 data22.1.sav 文件 ， 打 开 即 可 得 到 图 22-12。 如 
果 在 打开 过 程 中 ,中 文 出 现 乱 人 码 请 忽视 , 等 数据 库 打开 后 , 再 进行 修改 即 可 , 为 保险 起 见 ， 
变量 名 称 最 好 不 用 中 文 ， 但 对 于 高 版 本 的 Medcalc 已 经 不 存在 中 文 兼容 问题 。 为 了 保证 
大 家 都 能 复 现 ， 对 上 述 指标 采用 中 文 拼音 进行 缩写 。 
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Complete dialog cx， 


图 22-12” Medcalc 打开 数据 / 图 22-13 ”Medcalc 数据 


凡 击 statistics 一 ROC curves 一 Comparison of ROC curves， 如 图 22-13 所 示 ， 强 出 
22-14。 


园 IMedcalc - data20-ROC.mc1 
File Edit Wiew Format Tools es Graphs Tests Sampling Window Help 
,Summary statistics.,, 


| 御 目 鸟 | 是 加 | 水 旬 色 息 ra -eryus|x x|E: 


Disinbution plot 和 


Data 
ns Hotes Correlation 
] i 内 Yoriablas Regression | 
Hi “Y Gelerction criterla 人 D E F G 
胸围 ” 肺 呼 量 


Rank sum tests 


880 5585 
Variance ratio test (F-test),,, 820 3079 
PR 1050 5562 
一 一 ) 880 4328 
Categorical data A 82 0 4283 
Survival analysis | 860 4237 
Meta-analysis “1 830 4840 
Serial measurements... 830 5049 
Reference interval.., 83.0 4113 

800 3800 


ROC curve analysis... 
Interactve dot diagram... 
Plot versus criterian values.. 


Predictive values 


| : | | Inteval likelihood ratios 
mL 1 180.0 60 
| 18| 1 1790 674 ca | 


| 19| 1 1790 610 761 


图 22-14 ROC 曲线 比较 菜单 


如 图 22-14 所 示 ， 将 4 指标 放 入 变量 框 ，Group 放 入 分 类 变量 框 ， 右 上 角 方 法 选择 
Delong 法 ， 右 下 角 作 图 ， 义 选 添 加 标记 点 。 扣 击 “OK” 运 行 。 结 果 和 人 简单 ， 直 接 找 检验 统 
计量 和 了 值 即 可 ， 见 图 22-16 到 图 22-18。 
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tomparnscn of ROC curwes | _? mk 


ethocologYy 
入 0eLong etal. 3 
人 Haney & McNel 


Binemial exact Confidence Interval for the AUC 


Distlay ROC curves window 
区 | Mark points corespondng to on values 


40 60 
100-Specificity 


图 22-16 多 指标 ROC 曲线 结果 


80 100 


Vanable1 fH 

Vanable2 36 

vanable3 

vanabled CA 
Classification variable 


‘Sample size 0 
Fostve group: goup=s1| 
Negative group : 


0.00829 0.933to 0.969 

0.00972 0.913to0.955 
to 0.842 
XW : 712 : 0.0208 0.673 to 0.748 
a DeLong et al 1988 
b Binomial exact 


图 22-17 ROC 曲线 下 面积 
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FHL ~ SG 


a | 
Difference between Aareas 0.0166 
FF 十 目 十 旧 呈 目 十 轩 计 上 
I | 已 
Al ITQOT | 
a TT EE 国生 秆 和 和 和 站 让 


95%% Confidence Interval -0.00473 to 0.0379 
z statistic 1.524 
Significance level P= 0.1276 
FHL ~ TZ 

Diffterence between areas 0.142 
Standard Error™ 0.0170 
95%0 Confidence Interval 0.109 to 0.1754 
z statistic 8.352 
Sigmficance level P<=0.0001 
FHL ~ XW 

Diffterence between areas 0.241 
Standard Error - 0.0203 
95%% Confidence Interval 0.202 to 0.281] 
z statistic 11.882 
Sigmficance level P = 0.0001 
SG ~ TZ 

Difference between areas 0.125 
Standard Error 0.0153 
95%% Confidence Interval 0.0952 to 0.155 
z statistic 8.17] 
Sigmficance level P= 0.0001 
SG ~ XW 


Difference between areas 0.2235 

ee ee 0 
0 0 ER 
人 和 -0 
es WE 人 
TZ~ XW 


Difference between areas 
Standard Frror - 
95%% Confidence Interval 


z statistic 


0.0996 
se 0 


Sigmficance level 
“DeLong et al.,1988 


22-18 ”ROC 曲线 面积 比较 
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22.2.3 问题 (3 ) 多 指标 联合 诊断 


表面 我 们 学 过 Logistic 回归 ， 我 们 可 以 利用 身高 、 体 重 、 膨 围 和 肺 呼 量 去 预测 性 别 ， 
去 构建 一 个 二 项 Logistic 回归 模型 ， 然 后 将 logistic 回归 的 预测 概率 值 作为 一 个 新 的 综合 
指标 ， 然 后 再 诊断 大 学 生 的 性 别 。 

(1) 打开 上 述 22.1.sav 数据 库 。 将 组 别 放 入 因 变 量 ， 将 身高 、 体 重 、 胸 围 和 肺 呼 量 
放 入 协 变量 框 ， 如 图 22-19 所 示 。 

(2) 点 击 “ 保 存 ”， 如 图 22-20 所 示 ， 勾 选 预测 值 “概率 ”。 


学 华 修 人 2) 
标准 化 (NN) 
杠杆 值 已) 偶 董 (V) 


回 DfBeta(s) 
，， ， 区 将 棋 型 信息 导出 到 XML 文件 
ee EL 
i ET 园 包括 协 方 着 兴隆 | 


图 22-19 ”Logistic 回归 图 22-20 ”Logistic 回归 : 保存 


(3) 运行 结果 ， 如 图 22-21 所 示 ， 在 数据 视图 ， 产 生 预 测 的 概率 值 。 
(4) 继续 进行 ROC 曲线 ， 如 图 22-22 所 示 ， 将 产生 的 预测 概率 放 入 协 变 量 框 。 


一 RDOC 曲 尘 


组 别 2 身 高 ?体重 ?胸围 肺 中 
1 1 184.0. 71.0 | 88.0 | 5595 
1 184.0 65.0 82.0 3079 
[3 | 1 183.0 98.0 105.0 5562 i 
4 1 182.0| 70.0 88.0 | 4328 村 页 和 对 负 堆 洛 综 | 
3 1 181.0 57.0 82.0 | 4283 , 909 而 标准 误 莽 和 嗜 售 区 间 上 E) 
6 1 181.0 76.0 86.0 4237 ， [ 一 ROC 曲 益 的 坐标 点 
了 1 181.0| 65.0 | 83.0 | 4840 
8 1 181.0| 66.0 83.0 | 5049 
9 1 181.0| 57.0 | 83.0 | 4113 
10 1 181.0 58.0 80.0 3800 


图 22-21 Logistic 回归 结果 数据 视图 图 22-22” ROC 曲线 
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结果 解读 

由 图 22-23 可 见 ， 图 中 1 号 标记 的 曲线 其 曲线 下 面积 最 大 ，1 号 曲线 为 预测 概率 ， 可 
见 Logistic 回归 联合 概率 预测 的 诊断 价值 更 大 。 图 中 1 代表 预测 概率 ，2 代表 肺 呼 量 ，3 
代表 身高 ，4 代表 体重 ，5 代表 胸围 。 


曲线 下 方 的 区 域 


渐 近 95%% 置信 区 间 
| Te 本 “中 


标准 误差 ? 。 渐 近 显著 性 


身高 
体重 
脐 围 
肺 呼 量 
预测 概率 


DEL 二 :一 
00 02 04 06 08 10 omeepe 
1- 特 异性 b. 原 很 设 : 真 区 域 = 0.5 
图 22-23 ”ROC 曲线 结果 图 22-24 曲线 下 面积 

知识 拓展 

(1) 虽然 上 面 利用 Logistic 回归 联合 预测 因子 进行 ROC 诊断 的 效率 最 高 ， 但 很 多 
人 认为 缺乏 实际 可 操作 性 。 因 为 预测 概率 必须 通过 模型 得 出 ， 不 是 实际 可 观测 的 指标 。 
于 是 利用 Logistic 回归 得 到 方程 ， 比 如 : Logit (P) =5x 身高 +25x 体重 -15x 胸围 ， 此 时 
把 Logit(P) 就 当 作 联 合 预测 因子 IL， 让 后 面 所 有 的 系数 除 以 最 小 的 系数 (其 实 除 以 其 
中 的 任何 一 个 都 可 以 ， 本 例 除 以 5) ， 则 方程 [=1x 身高 +5x 体重 -3x 胸围 ， 然 后 将 受 试 
者 身高 、 体 重 和 胸围 代入 方程 ， 得 到 工 评分 ， 对 工 评分 再 次 进行 ROC， 寻 找 界 值 ， 这 种 
方法 的 可 操作 性 较 强 。 因 为 以 后 只 要 检测 了 上 述 3 指标 ， 直 接 就 能 得 到 工 评分 ， 根 据 寺 
评分 大 小 束 能 进行 诊断 或 者 风险 预测 了 。 

(2) ROC 曲线 除了 计量 资料 外 ， 等 级 资料 也 可 以 做 ROC 曲线 ， 常 见于 影像 学 分 析 ， 
做 法 同 计量 资料 ROC 曲线 ， 此 处 不 葡 。 
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在 研究 民 与 了 之 间 的 关系 时 ， 第 常会 受到 第 三 个 变量 的 影响 ,根据 第 三 
了 的 作用 ， 可 以 分 为 中 介 效 应 和 调节 效应 。 


23.1 ”中介 效 应 与 调节 效应 简介 


在 社会 科学 研究 中 , 研究 自 变 量 (X) 对 应 变量 (了 影响 时 , 常会 受到 第 三 个 变量 (M) 
的 影 啊 。 如 果 影 响 模式 如 图 23-1 所 示 ，M 仅 对 了 有 影响 ， 但 M 与 没有 关系 时 ， 我 们 
可 以 把 M 当做 协 变 量 来 处 理 ，X 与 M 均 为 分 类 变量 时 ， 采 用 方差 分 析 ; 为 分 类 ，M 为 
连续 变量 ， 可 以 采用 协 方差 ; 对 为 连续 ，M 为 连续 ， 采 用 回归 分 析 ; 了 革 为 连续 ，M 为 分 类 ， 
可 以 采用 分 层 回 归 分 析 进 行 解 释 。 

然而 很 多 时 候 , M 对 会 发 生 一 定 的 作用 , 如 XY 通过 MM 影响 了 的 中 介 作 用 , 如 图 23-2(a) 
部 分 中 介 作 用 ,了 对 了 有 直接 作用 ， 也 可 以 通过 M 对 了 起 作用 ， 犹 如 对 和 了 是 同班 同学 ， 
但 是 通过 M 正式 介绍 ， 成 为 男女 朋友 关系 ; 图 23-2(b》〉 完 全 中 介 作 用 ,针对 了 的 作用 
完全 通过 M 传达。 例如 ， 某 种 治疗 况 症 的 药物 (X) 需要 通过 特定 的 酶 (M) 才能 有 效 
杀 死 肿瘤 细胞 (了 ) ， 如 果 体 内 缺少 这 种 酶 ， 药 物 的 作用 将 失效 或 作用 大 大 降低 。 可 见 中 
介 变 量 是 参与 整个 因果 过 程 中 的 重要 一 环 ， 不 可 或 缺 ， 正 因 如 此 ， 中 介 效 应 分 析 的 前 提 
是 变量 间 存 在 明确 的 (理论 上 或 事实 上 的 ) 因果 关系 。 

另 一 种 情况 是 ,并 对 了 发 生 作 用 ， 但 作用 强度 的 大 小 与 方 回 会 受到 M 的 影响 ， 如 图 
21-3 所 示 ， 此 时 M 就 是 调节 变量 ， 所 发 生 的 效应 称 为 调节 效应 。 


M 
/ (b) / 
图 23-1 协 变 量 影响 模式 图 23-2” ”中介 效应 图 23-3 ”调节 效应 模式 


中 介 效 应 像 生活 中 的 媒 婆 ， 青 年 男女 通过 媒 婆 得 以 认识 ; 调节 效应 更 像 小 三 ， 时 时 
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刻 刻 影响 着 夫妻 之 间 的 关系 。 

在 统计 处 理 上 ， 中 介 效 应 通过 依次 回归 实现 ， 图 23-4 为 中 介 效 应 分 析 路 径 图 ， 自 变 
量 拒 对 因 变 量 了 的 影响 ， 如 果 蕊 变量 通过 影响 M 变量 来 影响 了 变量 ， 则 M 为 中 介 变 量 。 
通常 将 变量 经 过 中 心 化 转化 后 ， 得 方程 1， 天 c 台 el 方程 2: M=aXi+te,; 方程 3， 天 co 和 
bpM+e;。 其 中 , c 是 对 对 了 的 总 效应 ，a-b 是 经 过 中 介 变 量 M 的 中 介 效 应 ，c' 是 直接 效应 。 
当 只 有 一 个 中 介 变 量 时 ， 效 应 之 间 有 c=c'+ap， 中 介 效 应 的 大 小 用 c-cs=ab 来 衡量 。 


el T=cikte, 


M=axX+e, 


es T=cX+bM+e, 
图 23-4 ”中 介 效 应 依次 回归 路 径 


显 变 量 的 调节 效应 分 析 方 法 。 分 为 四 种 情况 讨论 。1) 当 自 变 量 是 类 别 变量 ， 调 节 变 
量 也 是 类 别 变量 时 ， 做 两 因素 交互 效应 的 多 因素 方差 分 析 ， 交 互 效 应 即 调节 效应 ; 2) 自 
变量 使 用 哑 变 量 ， 调 节 变 量 是 连续 变量 时 ， 将 因 变 量 、 自 变量 和 调节 变量 中 心 化 ， 做 = 
aX + bM+ el; 了 = aX+ DbM+cXM+ ee 的 层次 回归 分 析 : 也 做 了 对 对 和 MM 的 回归 ， 得 决 
定 系 数 Rj; @@ 做 了 对 天 M 和 XM 的 回归 得 R,,， 若 RR, 显著 高 于 RI,,， 则 调节 效应 显著 。 
或 者 ， 做 XM 的 回归 系数 检验 ， 若 c 显著 ， 则 调节 效应 显著 3) 当 自 变量 是 连续 变量 ， 
调节 变量 是 类 别 变量 时 ， 做 分 组 回归 分 析 : 按 M 的 取 值 分 组 ， 将 因 变 量 和 自 变 量 中 心 化 
后 做 了 对 下 的 回归 ， 若 回归 系数 的 差异 显著 ， 则 调节 效应 显著 4) 当 自 变量 是 连续 变量 ， 
调节 变量 是 连续 变量 时 , 将 因 变 量 、 自 变量 和 调节 变量 中 心 化 后 ,， 同 2) 做 层次 回归 分 析 。 

潜 变 量 的 调节 效应 分 析 方 法 。 分 两 种 情形 讨论 : 1〉 当 调节 变量 是 类 别 变 量 时 ， 做 分 
组 结构 方程 分 析 。 做 法 是 ， 先 将 两 组 的 结构 方程 回归 系数 限制 为 相等 ， 得 到 一 个 x 值 和 
相应 的 自由 度 ， 然 后 去 掉 这 个 限制 ， 重 新 估计 模型 ， 又 得 到 一 个 x 值 和 相应 的 自由 度 。 
前 面 的 x 减 去 后 面 的 x 得 到 一 个 新 的 将 ， 其 自由 度 就 是 两 个 模型 的 自由 度 之 差 。 如 果 九 
检验 结果 是 统计 显著 的 ， 则 调节 效应 显著 ; 2〉 当 调节 变量 和 自 变 量 都 是 潜 变 量 时 ， 有 许 
多 不 同 的 分 析 方 法 ， 最 方便 的 是 Marsh，Wen 和 Hau 提出 的 无 约束 的 模型 。 

SPSS 实现 中 介 效 应 与 调节 效应 其 实 就 是 利用 回归 来 做 ， 近 年 Hayes 开发 了 一 球 专 门 
处 理 中 介 效 应 与 调节 效应 的 插件 ， 功 能 比 SPSS 实现 更 加 方便 与 强大 ， 可 以 处 理 76 种 中 
介 与 调节 效应 的 模型 ， 下 面 对 SPSS 实现 中 介 效 应 与 调节 效应 分 别 进行 介绍 。 
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> 23.2 中 介 效 应 SPSS 实现 


23.2.1 案例 实战 

研究 工作 认同 感 与 工作 绩效 之 间 心 理 因 系 〈 焦 虑 ) 的 意义 ， 数 据 见 data23.1.sav。 原 
始 数据 包括 : 工作 不 被 认同 、 和 焦虑 、 工 作 绩 效 3 个 变量 ， 试 分 析 焦 虑 是 否 为 领导 不 认同 
导致 工作 效率 下 降 的 中 介 变 量 。 

23.2.2 ”案例 解读 

本 例 研 究 的 目 变 量 (8 为 “工作 不 被 认同 ”; 中 介 变 量 (CM) 为 “焦虑 ”， 因 变量 
(7) 为 “工作 绩效 ”。 探 讨 焦虑 是 否 在 工作 不 被 认同 与 工作 绩效 间 的 作用 。 

23.2.3 ”实战 步 双 


(1) 打开 数据 data23.1.sav， 按 照 图 23-4 分 别 做 3 次 回归 ， 先 做 第 一 条 回归 ， 
Y=cATte,。 

(2) 分 析 一 回归 一 线性 ， 如 图 23-5 所 示 ， 将 工作 绩效 放 入 “ 因 变 量 ” 框 ， 工 作 不 
被 认同 放 入 “ 块 (B) ”， 方 法 选择 “输入 法 ”， 点 击 “ 人 确定 ”运行 。 


工作 业绩 与 工作 不 被 认同 线性 回归 
(3) 继续 做 如 下 2 个 方程 ， 如 图 23-6 和 图 23-7 所 示 。 


图 23-5 
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起 线性 回 昌 


起 北 性 回 昌 天 到 -| 


交工 作 赴 钙 认 同 [bt 


大 工作 球 被 认同 [br 
直 工作 结交 [gzjx] 


圳 年 虑 站 


2 
ey pr 
二 一 选择 恋 且 {EY: : 
a 
一 一 个案 标 世 ( 忆 ): 

+ 


一 一 ”WLS 权重 [H) : 
| 


图 23-6 工作 业绩 与 焦虑 和 工作 不 被 认同 线性 回归 图 23-7 焦虑 与 工作 不 被 认同 线性 回归 


my 


个案 标 蔚 (CC) : 
路 


23.2.4 结果 解读 


(1) 图 23-8 为 工作 乡 效 与 工作 不 和 梓 认 同 线性 回归 结果 ， 王 414.265，P=0.000， 说 
明 回 归 模 型 有 意义 ， 工 作 不 被 认同 1 检验 本 20.354，P=0.000， 回 归 系 数 有 意义 ， 标 准 化 
归 系 数 为 0.678， 即 模型 天 cge 中 ，c=0.678。 
图 23-9 为 工作 绩效 与 焦 不 、 工 作 不 认同 回归 结果 ， 即 方程 于 c'X+tbMite; 分 析 
结果 ， 得 到 F=235.490，P=0.000， 模 型 有 意义 ; 焦虑 与 工作 不 被 认同 回归 系数 检验 ，P 
均 小 于 0.05， 说 明 回 归 系 数 有 意义 ， 本 例 c'=0.564，5=0.213。 


- 


回归 206.308 1 206.308 二.265 0.000° 1 回 娄 220.897 2 110.449 35.490 og.000 
三 其 242.531 4 日 7 0.498 残 芋 227.941 486 0.469 We 


总 计 448.939 4 日 昌 
a. 因 变 量 : 工作 绩效 
b. 预测 变量 : (常量 ), 焦 虚 , 工作 趟 被 认同 


Bi M0.639 4 
a. 因 变 最 : 工作 绩效 
b. 预测 变量 : (常量 ), 工作 不 被 认同 


EE 
系数 
. \ = 未 标准 化 系数 标准 化 系数 
未 标 . 住 { 上 了 标准 化 率 数 | 向 型 BE 标准 误差 Beta t 显著 性 
模型 B 标准 误 著 Beta t 显 者 性 1 (党 最 ) 0.418 0.092 
1 (常量 ) 0.608 0.088 工作 不 被 认同 0.670 0.045 
工作 和 不 被 认同 0.804 0.040 0.678 焦虑 0.225 0.040 
a. 因 变 量 : 工作 绩效 z a. 因 变 量 : 工作 缚 效 


图 23-8 工作 绩效 与 不 认同 结果 图 23-9 ”工作 绩效 与 焦虑 、 工 作 不 认同 回归 结果 


(3) 图 23-10 为 焦虑 与 工作 不 被 认同 回归 结果 ， 即 方程 M=aXte, 结果 ，Ff=193.247， 
P=0.000， 说 明 建 立 的 回归 方程 有 意义 ; 工作 不 被 认同 回归 系数 1 检验 ， 太 13.901， 产 
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0.000， 回 归 系 数 有 意义 ， 方 程 中 的 系数 a=0.533。 


ANOVAa 
模型 平方 和 自由 度 均 方 
1 回归 113.871 1 113.871 
OO 束 关 286.966 487 .S60 
总 计 ”400.837 488 
a. 因 变 量 : 焦 虚 
b. 预测 变量 : (常量 ), 工作 乎 被 认 同 
大 
未 标准 化 率 数 标准 化 杀 数 
慌 型 日 标准 误 症 Beta t 显著 性 
(党 最 ) 7 | 


工作 不 被 认同 
a. 因 变 量 : 焦虑 


23-10 焦虑 与 工作 不 乌 认 同 回归 结 采 


因此 本 例 是 部 分 中 介 效 应 。 自 变量 “工作 不 被 认同 ”对 因 变 量 “ 工 作 绩 效 ” 的 中 介 
效应 不 完全 通过 中 介 变 量 “ 焦 虐 ” 的 中 介 来 达到 其 影响 , “工作 不 被 认同 ” 对 “工作 绩效 ? 
有 部 分 直接 效应 ， 中 介 效 应 对 总 效应 的 页 献 率 为 : 

Effect M=ab/c=0.533x0.213/0.678=0.167 (16.7%) ， 中 介 效 应 多 
异 为 sqrt (0.490-0.459) =0.176 (17.6%) 。 


释 了 因 变 量 的 方差 变 


> Eb ) 


调节 效应 根据 目 变 量 丈 与 调节 变量 M 的 变量 属性 的 不 同 ， 统 计 分 析 见 表 23-1。 


表 23-1 显 变量 调节 效应 的 分 析 方 法 


自 变量 ( X ) 


分 组 回归 : 按 MY 的 取 值 分 组 ， 做 了 对 甘 的 
回归 。 夺 回归 系数 的 差异 显 厦 ， 则 调节 效 
应 显著 。 


两 因素 有 交互 效应 的 方差 分 析 (ANOVA) ， 
交互 效应 即 调节 效应 。 


目 变 量 使 用 伪 变 量 ， 将 和 目 变量 和 调节 变量 中 心 


化 ， 做 将 自 变量 和 调节 变量 中 心 化 ， 做 
Y=aX+pM+cXM+e J=aX+pM+cXM+e 

的 层次 回归 分 析 : 的 层次 回归 分 析 〈 同 左 ) 。 

1. 做 了 对 开 和 戏 的 回归 ， 得 测定 系数 Ri。 ”| 除了 考虑 交互 效应 项 XM 外， 还 可 以 考虑 

2. 做 了 对 XM 和 XM 的 回归 得 尺 ， 若 尺 显 | 高 阶 交互 效应 项 (如 XM?， 表 示 非 线性 调 

著 高 于 局， 则 调节 效应 显著 。 或者， 做 XW 的 | 节 效 应 ，MX?， 表 示 曲 线 回归 的 调节 ) 

回归 系数 检验 ， 若 显著 ， 则 调节 效应 显著 


23.3.1 ”案例 实战 


= 
ml 


23.3.2 ”案例 实战 
打开 数据 ， 分 析 一 一 般 
将 性 别 、 性 格 放 入 “固定 因 
对 此 保持 时 


a 
分 析 结 : 


因 变 最 : 得 分 
汤 _ 
由 正 模型 


总 计 
峰 正 后 总 计 


项 心理 学 研究 中 ， 系 研究 者 研究 教师 的 性 格 与 性 别 对 学 生 考 试 得 分 的 
折 性 格 在 教师 性 别 与 学 生 考试 得 分 中 是 否 表 现 为 调节 作用 ， 数 据 见 data23.2.sav。 


线性 模型 
子 ” 框 , 模型 
认 。 据 击 “确定 ” 运 运行 。 
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乡 啊 ， 判 


变量 ”， 
型 , 即 考虑 交互 作用 的 模型 ， 


1 WWL3 权 蕴 : 


EAD = E 呆 … 白 | 来 曲 目 T 


图 23-11 单 变 量 设置 


见 图 23-12， 可 见 性 格 (character〉 和 性 别 (gender) 对 得 分 均 有 作用 ， 但 


性 格 与 性 别 之 间 没 有 交互 作用 ， 


即 没有 调 廊 作用 。 


主体 间 效 应 检验 
川 类 平方 和 目 由 度 吉方 F 四 者 性 
175.867" 5 35.173 5.914 0.000 


和 1 lk dk OE 


4016.000 120 
853.867 119 
a. 民 方 = 0.206 [调整 后 民 方 = 0.171) 


图 23-12 单 变量 结果 
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> 23.4 调节 效应 SPSS 实现 ( /为 分 类 


23.4.1 “案例 实战 

某 研究 者 研究 胸围 对 肺 呼 量 的 影响 ， 考 虑 到 性 别 可 能 会 走 
data23.3.sav， 试 对 数据 进行 分 析 。 

23.4.2 案例 实战 


(1) 打开 数据 库 ， 点 击 有 来 单 ， 数 据 一 拆 分 文件 ， 如 图 23-13 设置 。 
(2) 分 析 一 回归 一 线性 ， 如 图 23-14 所 示 ， 将 肺 呼 量 放 入 “ 因 变 量 ”， 胸 围 放 入 “ 块 
(B) ”， 统 计 按 钮 勾 选 “R 变化 ”。 


图 按 分 组 变量 进行 文件 排序 (S) 
@@ 文件 已 排序 (E) 国王 


图 23-13 ” 拆 分 文件 图 23-14 线性 回归 设置 


23.4.3 ”结果 解读 


(1) 模型 验证 分 析 结 果 见 图 23-15, 可 见 男 生 组 和 女生 组 的 回归 模型 都 是 有 意义 的 。 
Fa=102.889, P=0.000, Fs =6.974，P=0.009。 

(2) 模型 方程 结果 见 图 23-16， 根 据 男 生 、 女 生 胸 围 的 回归 系数 的 t 检 验 结 果 ， 发 
现 回归 系数 均 是 有 意义 的 。 然 后 需要 对 2 个 回归 系数 进行 假设 检验 ， 但 SPSS 不 能 直接 
对 2 个 回归 系数 进行 检验 ， 但 可 以 计算 其 各 目的 95% 可 信和 区 间 。 友 现 男 生 胸 围 回归 系数 
的 95%CI: 47.802 一 70.814; 女生 胸围 回归 系数 的 95%CI: 2.656 一 18.204， 两 个 95% 
可 信 区 间 之 间 没 有 重合 ， 或 者 说 完全 分 离 ， 因 此 ，2 个 回归 系数 之 间 差 异 有 统计 学 意义 。 
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对 肺 呼 量 的 作用 。 


ANOVA” 
性 下 ” 模型 平方 和 自由 度 均 方 


男 1 回 娄 32369576.96 1 32369576.96 | 102.889 0.000 
残 车 94696213.44 301 314605.360 四 
总 计 127065790.4 302 
如 1 回 娄 1666067.649 1 1666067.649 6.974 0.009 
残 莽 68082642.78 285 238886.466 站 
总 计 69748710.43 286 
a. 因 变 量 : 肺 呼 量 
b. 预测 变量 : (常量 ), 胸围 


进一步 说 明 性 别 会 调节 胸 


图 23-15 模型 检验 


系 守 E 
未 标准 化 系数 标准 化 系数 日 的 95.0% 置 倍 区间 
性 别 “模型 BG 标准 误差 Beta t 显著 性 下 限 上 限 


-11 


由 1 【前 量 ) -1081.788 490.926 -2.204 0.028 -2047.871 


5.706 
5.847 0.505 二 


你 1 ( 带 量 ) 。 T1667039 317.694 5.310 0000 1061715 2317364 
; | 3.950 B15 


= 23.5 调节 效应 SPSS 实现 (/M 为 
者 连续 变量 ) 


23.5.1 ”案例 实战 


有 研究 者 研究 胸围 对 肺 呼 量 的 影响 ， 考 虑 到 身高 可 能 对 其 产生 调节 作用 ， 数 据 见 
data23.4.sav， 试 做 统计 分 析 。 


23.5.2 ”案例 实战 

(1) 打开 数据 ， 点 击 转换 一 计算 变量 ， 计 算 新 的 变量 WE 胸围 x 身高 ， 如 图 23-17 
所 示 。 
将 身高 和 胸围 放 入 “ 块 (B) 1/2”。 


(3) 点 击 “ 统 计 ”， 义 选 “R 方 变化 量 ” 和 系数 95% 区 间 ， 如 图 23-19 所 示 。 
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下 外 让 是 ID : 


所 呈 且 一 一 


主 P 

算术 

CDF 久 赤 中 心 CDF 
和 


迁 返 变革 眉 ) : 


国 一 


| | z WLS 椒 重 冉 ) : 
下 和 潜 打 付 ] 下 本 


图 23-17 计算 变量 图 23-18 ”层次 回归 设置 


(4) 扩 击 “继续 ”， 弹 出 图 23-20, 将 XM 放 入 “ 块 (B) 2/2”， 扩 击 “ 确 定 ” 运 行 。 


彤 共性 回 昌 Ex 


al | 
2 | 


2 -起 (B212 


剧 | 下 | 二 区 辣 册 
级 别 (%): 65 | 
EE 


蕊 德 宾 - 沃 森 (UI) 

个 案 访 断代 ) 
圈 高 群 值 (D) : |3 | 标准 着 
区 所 有 个 案 (A) 


图 23-19 统计 设置 图 23-20 ”层次 线性 回归 设置 


23.5.3 ”结果 解读 


(1) 模型 RR 方 , 由 图 23-21 可 知 模型 2 的 RR 方 0.574 比 模型 1 的 R 方 0.548 多 出 0.026， 
这 就 是 玉 方 变化 量 ，P=0.000<0.05， 因 此 RR 方 变 化 量 是 有 意义 的 。 


模型 摘要 
更 改 统计 
标准 估 入 时 误 显著 性 F 变化 
同型 R R 方 调整 后 R 方 节 R 方 变化 最 变化 最 自由 度 1 自由 度 2 量 
1 0.741a 0.550 0.548 601.196 0.550 -358.445 2 587 0.000 
0.759° 0.576 0.574 584.105 TOT oT 


a. 预测 变量 ; (常量 ), 身高 , 胸围 
b. 预 届 变量 : ( 帝 量 ), 对 高 , 胸围 , XM 


图 23-21 模型 摘要 
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(2) 方程 检验 ， 由 图 23-22 可 知 ，2 个 模型 已 均 为 0.000， 小 于 0.05， 因 此 2 个 模 
型 省 有 统计 学 意义 。 


ANOVA? 
横 型 平方 和 自由 度 均 方 
1 回归 ”259110248.1 2 129555124.0 |358.445 0.000° 
残 差 。 212163066.8 587 361436.230 
总 计 471273314.9 589 
2 回归 ”271342825.5 3 90447608.49 
残 差 。 199930489.4 586 341178.310 We 
剖 计 471273314.9 589 


a. 因 变 量 : 肺 呼 最 
b. 视 测 变量 : ( 沉 量 ), 身高 , 胸围 
5. 了 RM 测 变量 : ( 攻 量 ), 身高 , 千 围 , XM 


图 23-22 方程 检验 
(3) 方程 系数 ， 由 图 23-23 可 知 XM( 即 胸围 x 身高) 的 回归 系数 为 2.059， 
二 5.988，P-0.000<0.05， 因 此 XM 回归 系数 是 有 意义 的 ， 即 意味 着 身高 对 胸围 与 肺 呼 量 
间 的 作用 存在 着 调节 作用 。 


A 
未 标准 化 勾 数 标准 化 系数 日 的 95.0% 置 售 区间 
1 【名 最 上 -10962.992 530.571 -20.663 0000 -12005.042 -9920.943 
赎 围 25.913 3.908 0.194 6.631 0.000 18.237 334.588 
评 启 | 73.377 3.285 0.655 22.338 0.000 66.926 79.829 
2 (常量 ) 16579.651 4628.578 3.582 0.000 i489.030 25670.273 
幅 围 -301.905 与 号 879 -2.264 -5 .501 0.000 -09.688 -194.121 


图 23-23 ”回归 方程 


-> 23.6 Process 插件 安装 


上 面 介绍 的 都 是 基于 SPSS 实现 中 介 效 应 与 调节 效应 的 方法 ， 过 程 稍微 复杂 那么 一 
点 ， 于 是 Andrew FHayes 博士 ， 专 门 编写 了 一 个 基于 SPSS 的 中 介 效 应 与 调节 效应 分 析 
的 Process 插件 ， 安 装 后 ， 可 以 直接 在 SPSS 中 利用 菜单 和 GUI 窗口 进行 中 介 与 调节 效应 
分 析 。 目 前 Process3.0 已 经 可 以 处 理 92 种 模型 ， 实 力 非常 强劲 。 
安装 步骤 
(1) 打开 SPSS24.0 软件 ， 点 击 菜 单 扩展 一 实用 程序 一 安装 定制 对 话 框 (兼容 方式 ) ， 
如 图 23-24 所 示 。 如 果 是 SPSS23 及 以 前 版 本 ， 如 图 23-25 所 示 。 
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芬 析 过 ) ”直销 册 ) ”图 形 {G) 实用 程序 LI) ”窗口 (W) ”都 助 (H) 
弹 变量 V).. 
| 变量 | 变量 | 轧 OMS 控制 面板 
妆 明 | 奕 虹 | : 各 CMS 标记 由. 
贿 评分 自 导 QW).. 
[ 曲 各 并 模型 XML.. 
使 用 透视 表 进 行 计算 
加 数据 文件 注释 (C) 
定义 训 量 志 
人 并 查看 器 表 .. 
各 定 闪 变量 集 蝶 ). 
容易 表 
名 使 用 变 县 集 (U) 
网 中 示 所 有 变量 (A) 
创建 文本 输出 
这 行 Python 程序 
坑 拼 气 (8). 
扩展 人 OW RH 处 理 数据 浆 件 
本 扩展 中 心 [H}.. 训 二 行 妓 本 代 ) 
有 条 旧地 执行 代码 员 
半 产 设施 (FP).. 
播放 声音 


| -| -| 


实 装 丰 地 扩展 束 册 . 
国 用 于 扩展 的 定制 奈 话 框 构 强 程 床 [ 山 ) 


空 用 程序 代 ) 间 建 扩展 束 [C) 
I 闹 嘱 扩展 束 (E). 地 图 赎 执 实用 程序 (MM).. 
国 定制 对 话 框 构建 程序 【 羔 窗 性 方式 )(B) . 赵 制 对 话 框 (D) | 国安 关 定 币 对 话 模 (D)- 
内 亡 装 定制 对 话 柜 【 妾 容 性 方式 ) 上 D)- | 扩展 束 虽 ) 定制 对 话 框 构建 程序 昌 ) 


23-24 SPSS 24.0 及 之 后 版 本 插件 安装 位 置 图 23-25 SPSS 23.0 及 之 前 版 本 插件 安装 位 置 


(2) 找到 Process 安 攻 程序 ， 你 可 以 到 Andrew F.Hayes 博士 主页 下 载 ， 也 可 以 见 随 
书 数据 文件 ， 主 页 网 址 (http: /wafhayes.comyindex.html) 。 安 装 成 功 弹 出 图 23-27 确定 页 
面 ， 点 击 “ 确 定 ”， 此 时 Process 插件 就 安装 成 功 J。 
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© 对 省 惨 交 件 已 吉 装 到 : 
Anabyee anahze_regression>PROGESS YO by new tH. Hayes -= 


:| 些 吾 的 正 $IR 放 框 包 误 忻 亡 -9 折 二 


图 23-26 ”安装 对 话 框 图 23-27 安装 成 功 确定 页 面 


(3) Prcoess 所 在 位 置 ， 在 图 23-28， 分 析 一 回归 中 ， 细 心 的 你 会 发 现 ， 松 哥 安装 
了 2 个 版 本 的 ， 上 而 为 Process 3.0， 下 而 为 Process 2.16， 建 议 大 家 安装 3.0 版 本 ， 因 为 
Process 2.16 只 能 处 理 76 个 模型 ，Process 3.0 可 以 处 理 92 个 模型 。 


分析 (2) 
报告 如 ) 
j 状 让 这 寺 诺 )] 
表 {8) 
比 轩 平均 展 (M) 
一 般 闪 性 模型 民 ] 
| 广 各 维 性 棋 型 (Z) 
混 台 棋 型 x) 
Ew[C) 
HR) 
周 数 找 性 (D) 
宰 汉 网 半 吕 W 
分 类 全 |) 
施 准 加 ) 
标 度 上 | 
非 驮 数 术 驻 必 h) 
时 间 序 列 预 测 [I) 
平生 仓 析 ( 豆 ] 
杀生 响应 (UI) 
加 扣 具 值 吨 析 他 1. 
| 条 重 插 补 全 ) 
爱人 亲 抽 冬 凡 ) 
鲁 | 模 根 们 .- 
质量 控制 亿 ) 
RDOC 曲 站 | 同 . 


图 23-28 


直销 MW ”图形 候 ) 
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ee 扩展 避 ”窗口 QM 帮助 由 ) 


[二 


目 动 暑 性 建 覃 邮 ) 
绕 性 必 L) 
由 找 估 重 (G). 
部 分 景 小 平方 {8).. 
PROCESSY3.0 byAndrewF. Hayes 
较 二 元 Loglstic 
装 元 Logistictw). 
有 序 亿 1 
概率 (已 ) - 
PROGESS, by Andrew F. Hayes Mttp:iirew.athayes.comb 


直线 性 全 ) 
想 重 估算 fw) 
二 防 早 小 平方 辐 .- 


旦 基 标 度 [CATREGNOY.. 


安装 后 Process 所 在 位 置 


继续 以 前 面 data23.1 案例 为 例 ， 


23.7.1 ”实战 步 又 


采用 Process 进行 中 介 效 应 分 析 。 


(1) 分 析 一 回归 一 Process, 弹出 图 23-29, Process 主 界面 ,将 工作 绩效 放 入 “了 变量 框 ”》 


将 焦虑 放 入 “Mediator (S) ” 框 ， 工 作 不 被 认同 放 入 “变量 框 ”， 


模型 数 选 择 4。 


畅 PROCESS wersien 30 by Andrew F. Hayes 


variables: 


Mumbser of boolstrap samples 


Saw bootstrap eetimalas 


站 Boclstrap inferance for model cas 和 thciants 


图 23-29 ”Process 主 对 话 框 
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(2) Model number 如 何 设 置 。Process 虽然 可 以 实行 对 话 框 操 作 ， 但 如 何 选 择 模 型 ， 
必须 要 有 Process 模型 选择 手册 ， 见 数据 文件 ， 图 23-30 和 图 23-31 符合 我 们 本 例 研 究 。 
4， 看 好 


因此 选择 4。 如 过 你 以 后 进行 目 己 数据 的 分 析 ， 一 定 先 在 手册 中 找到 对 应 的 模 : 
尽 几 写 模 型 ， 然 后 正确 选择 才 可 以 进行 正确 的 分 析 ， 否 则 惑 会 出 错 了 。 


Statistical Diagram 


Model4 
Conceptual 


Indirect effect of X on Y through M=ab, 
Direct effect of X on Y=ec' 
Note:Model 4 allows up to 10 mediators operating in parallel. 


图 23-30 ”简单 中 介 模 型 图 23-31 简单 中 介 对 应 的 统计 模型 


(3) 点 击 option: 选择 “show total effect model”， 点 击 “ 确 定 ”， 如 图 23-32 所 示 。 


Painwise contrasts of indirect effects 

r- Moderation and conditioning 
P| Effed size (mediation-only models 
( # ) Probe interactions... 


CGonditioning values 
辑 16th, 50th, 84th percentiles 
名 -1SD, Mean +1SD 


Johnson-Meyman output 


Mean center for construction of products 


图 23-32 ”Process option 设置 


23.7.2 ”结果 解读 

(1) 模型 摘要 : 图 23-33 告诉 我 们 采用 模型 4， 了 Y、 对 和 MM 分 别 为 什么 变量 ， 以 及 
样本 量 为 489 人 。 后 续 给 出 3 个 模型 ， 结 果 解 释 参 见 前 面 SPSS 实现 部 分 ， 此 处 不 葡 。 

(2) 效应 结果 ， 如 图 23-34 所 示 ， 因 为 是 自 编 插件 ， 非 官方 正式 产品 ， 因 此 结果 会 


| 第 23 章 ”中介 效 应 与 调节 效应 | 363 


有 一 点 点 的 错位 ， 由 图 23-34 可 知 蕊 和 了 的 总 效应 为 0.8042，95%CI: 0.7266 一 0.8819， 
P-0.000<0.05， 因 此 下 了 总 效应 有 统计 学 意义 。 了 对 对 了 的 直接 效应 为 0.6695，95%CI: 
0.5805 一 0.7586，P=0.000<0.05， 因 此 了 对 了 存在 直接 效应 。 对 对 了 的 间接 效应 为 0.1347， 
95%CI: 0.0806 一 0.1950。 因 此 本 例 焦 虑 对 工作 不 被 认同 对 工作 绩效 的 影响 模型 为 间接 
中 介 模 型 。 如 果 本 例 直接 效应 无 统计 学 意义 ， 那 么 就 是 完全 中 介 模 型 。 后 面 B 部 分 告诉 
我 们 采用 的 是 95% 可 信 区 间 进 行 了 5000 次 自 抽样 计算 。 


Tortal affecr of 2 on Y 
Etre et 5 站 t p LLEI UL 
Bm MATRIX procedure: D83042 0.03535 20.3535 O0000 O72565 0.89193 


i PROCESS Procadurea for SPSS Yersionm 3 和 证 二 圳 让 训 训 有 南 训 圳 训 圳 训 评 计 ee 
” ee | ' Eftre et 5 交 t p LLCI ULCI 
QE695 O0453 147731 O0000 GSB805 O586 
Whttan by Andrew F, Hayes, Ph,D, Www ,afhayes, om 


Documentation available in Hayes (20138) www.guilford.com/ipihayes3 Indirect effectls) of X on Y: 
Effect BocorwsE BoearLLel BoariLel 


| Dl34F OV2931l MOS06 O1950 


有 皮衣 贸 衣 上坟 稍 有 有 有 有 尚 和 订 有 市 认 上 而 有 而 上 商 六 而 有 有 有 有 调和 而 有 计生 证 有 而 有 而 有 有 有 有 


寅 言 烦 雇 知 规 首 座 半山 言 雇主 病症 间 同 站 | 马 | 与 OTES 加 | 本 | ERRDRS 定价 言 诊 言 请 症 商 广 请 村 尖 证 放 计 疝 计 有 磺 亲 闹 证 坑 半 


Lavel of confidence far all confidenee incarvals im aurpur: 
39,00000 


Number of baotrstrap samples For percenmtile bootstrap confidence Interwals: 
SOO0 


------ END MATRIX --—-—- 


有 皮衣 斩 言 有 上 有 衣 有 有 疝 月 上 疝 和 六 有 前 有 六 有 而 上 有 有 而 有 证 有 而 上 上 


图 23-33 ”模型 摘要 图 23-34 ”间接 效应 分 析 结 果 


=> 23.8 Process 分 析 调 节 效 应 


以 data23.3 为 例 ， 采 用 Process 进行 统计 分 析 。 


23.8.1 实战 步骤 


(1) 首先 打开 Process 模型 选择 手册 ， 找 到 对 应 的 模型 ， 如 图 23-35 和 23-36， 应 该 
选择 Modell。 


Model 1 Statistical Diagram 


conceptual Diaeram 


Conditional effect of ¥ on Y=b.+hb MM 


图 23-35 Modell 模型 图 23-36 Modell 模型 统计 
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(2) 打开 数据 , 分 析 一 回归 一 Process, 如 图 23-37 所 示 , 将 肺 呼 量 放 入 了 , 胸围 放 入 了 XY， 
性 别 放 入 调和 区 效应 瑚 ”模型 选择 Modell。 

(3) Options 设置 如 图 23-38， 勾 选 “effect size”， 扣 击 “ 继 续 ”， 回 主 对 话 框 ， 
氮 击 “确定 ”运行 。 


PROCESS wersion 3.0 by 上 ndraws F, Hawes 


Warlatlers: 


站 | Cenerate Code tor visualizing interaciions 


| Show total effeci model {only models 4, 6, B80, 81, B2) Oemal al placesil in outpui 


El Pairmise contrasts of indirect effects 
Moderation and conditioning 


Effect si diation-anl del 
size {mediation-only models) Probe interactions... 


一 rr er | 
rr Fl] Mean center for Construclion of producs fp< 10 | 


Fr Condiioning valuas 
Number of baotstrap samples 量 164n, 50th, 84th percentiles 
Eile pm TE 总 -1480, Mean, +130 
RE + 中 CT DF Valarle 
Save boolstap etmal | 
es Ss Johnson-Neyman output 


EE] Bovisirap inference for model coefhicients Do not use PASTE buton 


图 23-37 Process ess 主 对 话 框 图 23-38 ”option 设置 


23.8.2 ”结果 解读 


(1) 模型 一 般 情况 ， 图 23-39 告诉 我 们 了 Y、 革 和 矿 如 何 定义 的 ， 以 及 590 为 样本 量 。 

(2) 模型 结果 ， 图 23-40 (A) 部 分 为 模型 摘要 ，R-sq (R 方 )=0.6546，P=0.000< 
0.05， 因 此 建立 的 模型 是 有 意义 的 。23-40 (B) 部 分 为 构建 的 具体 的 模型 ， 其 中 int 1 为 
胸围 与 性 别 的 交互 项 ， 系 数 为 -48.8777，P=0.000<0.05， 说 明 存 在 交互 作用 ， 意 味 着 调 
节 效 应 存在 。23-40(C) 部 分 为 交互 项 的 了 R 方 改变 量 值 为 0.0291，P=0.000<0.05， 因 此 ， 
增加 交互 项 ， 确 实 能 改变 模型 的 效能 ， 也 再 次 证 实 调节 效应 存在 。 


RUNn MATRIA procedure, UTCOMIE Wa RIABLE 
肺 池 
司 百 可 西西 西西 西西 西西 可 本 丁丁 FRI Es Pracedure far “Ps Wefslon 3 癌 口 丁丁 丁丁 丁丁 丁丁 丁丁 丁丁 本 机 丁丁 
Madel summarny 
R Rsq MSE F dfl df2 有 
Written by Andrew F, Hayes, FND, Wwiw,afhayes.cem DB031 UESdE 277779.618 37019039 S0000 5838,0000 0.0000 


Docurmentatien avallable Im Hayes (201 3) www .qulilfard.comj/p /hayes3 


山 家 时 家 有 有 红 肖 入 认 衣 山 家 条 宙 出 


5 所 P L 
袜 7 984.1508 -3.31z6 DOD0oLl -57B3.5081 
西 马 109.1B5G 11.7 各 46 9.1B02 D0000 85.0403 131.3309 BB 
性 到 276B.B27S -37d4.5351 4.31BG7 D000 1540.3109 3597.3442 
Py B91s DODDOD -82.5305 39,2248 


Praducrt cerms kew 
有 阮 转交 性别 


#49.4335 C1.0000 S536B.0000 -0.0000 


衣 让 上 午 胡 丰 沿 商 身 调 调 册 衣 身 吉 言 家 有 疝 肖 出 吉 守 吉 襄 出 调 夺 凋 凋 宙 调 上调 商 让 让 册 二 


图 23-39 ”模型 一 般 情况 图 23-40 ”模型 结果 
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(3) 分 层 分 析 结 果 ， 如 图 23-41 所 示 ， 按 照 性 别 分 层 ， 得 到 分 别 在 男生 和 女生 中 ， 
胸围 都 影响 肺 呼 量 。 


Focal pradict: 图 上 0) 
Mod war: 性 B80 Wi 


Conditiional effects of the focal predictor at values of the moderatortsy 


Level of confidence for all confidence intervals In output: 


935,0000 


NOTE: Viariables names longer than eight characters can produce INncorrect output, 
Sharter wariable names are recommended, 


图 23-41 分 层 分 析 结 果 


知识 拓展 

排除 R、SAS 软件 ， 以 SPSS 系列 分 析 为 例 ， 中 介 效 应 和 调节 效应 可 以 采用 SPSS 实 
现 、Process 实现 以 及 AMOS 实现 ，Process 可 以 完全 替代 SPSS 的 中 介 和 调节 效应 分 析 ， 
但 和 SPSS 一 样 ， 均 只 能 进行 显 变 量 分 析 ， 无 法 进行 潜 变 量 的 分 析 ; AMOS 可 以 实现 潜 
变量 与 显 变量 的 中 介 效 应 与 调节 效应 ， 中 介 效 应 上 比 Process 做 得 好 ; 但 对 于 显 变 量 的 调 
攻 效 应 ，Process 优 于 AMOS。 


今 > 第 24 章 倾向 性 评分 


科学 研究 组 间 比 较 往 往 要 求 基线 资料 可 比 , 或 者 说 一 些 重要 的 影响 因素 组 间 要 均衡 ， 
然而 来 自 真实 世界 的 研究 ， 往 往 达 不 到 这 样 的 要 求 。 对 于 这 种 情况 ， 一 般 研究 开始 前 对 
研究 对 象 进行 随机 分 组 ， 或 资料 进行 匹配 ， 数 据 收集 后 进行 分 层 分 析 或 者 多 因素 分 析 来 
进行 校正 。 

倾 回 性 评分 (propensity score, PS) 是 一 种 可 用 于 在 非 随 机 对 照 研究 中 涉及 较 多 混 
杂 因 素 情 况 下 做 因果 推断 的 方法 ， 是 研究 数据 已 经 收集 后 ， 再 对 基线 进行 匹配 的 方法 ， 
在 医学 、 心 理学 、 社 会 学 等 领域 的 应 用 日 趋 流 行 ， 但 目前 多 需要 编程 实现 ， 因 而 限制 了 
该 方法 的 普遍 使 用 。 非 统计 专业 人 员 最 常 使 用 的 软件 SPSS 中 尚 无 现成 的 PS 配 比 模块 ， 
但 是 可 通过 安装 有 关 插 件 获 得 点 击 式 分 析 模 块 ， 本 章 借助 SPSS 软件 进行 讲解 无 须 编 程 
的 倾 问 评分 模块 (PSM) 。 倾 问 性 评分 按 有 具体 用 途 ， 可 以 分 为 倾 问 性 匹配 、 倾 癌 性 分 层 、 
倾 问 性 评分 回归 和 倾 癌 性 评分 加 权 。 


叶 24.1 PSM 匹配 


24.1.1 人 简介 


倾 回 评分 法 (propensity score method) 是 由 Rosen-baum 和 Rubin 于 20 世纪 80 年 代 
提出 的 ，2000 年 之 后 ， 这 一 方法 日 益 受 到 人 们 的 关注 。 国 际 上 越 来 越 多 的 研究 者 将 倾向 
评分 法 应 用 到 流行 病 学 、 健 康 服务 研究 、 经 济 学 以 及 社会 科学 等 许多 领域 。 


24.1.2 ”基本 思想 


倾向 评分 法 能 够 将 多 个 混杂 变量 综合 为 一 个 变量 (倾向 评分 ) ， 通 过 平衡 两 对 比 组 
的 倾 回 评分 而 有 效 地 均衡 混杂 变量 〈 也 称 协 变量 ) 的 分 布 ， 从 而 达到 控制 混杂 偏 倚 的 目 
的 。 倾 加 评分 是 反映 所 有 观察 到 的 协 变 量 (均衡 变量 ) 在 两 组 间 均 衡 性 的 一 个 近似 函数 。 
它 最 大 限度 地 概括 了 特征 变量 的 作用 ， 因 而 可 以 有 效 地 保持 处 理 组 和 对 照 组 间 特 征 变量 
的 均衡 性 ， 使 两 组 间 各 个 特征 变量 均衡 一 致 ， 如 图 24-1 所 示 。 
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Population 
with varying 
characterlstics 


图 24-1 倾 回 性 评分 思想 


24.1.3 ”案例 实战 


某 位 医生 采用 2 种 治疗 方案 治疗 COPD， 研 究 效应 指标 为 COPD 病人 的 肺 呼 量 ， 但 
由 于 是 对 科室 既往 病例 的 回顾 性 分 析 ， 因 此 ，2 种 治疗 方案 组 人 群 的 身高 、 体 重 和 胸围 
基线 数据 存在 差异 ， 该 医生 想 采 用 倾 癌 性 评分 进行 匹配 基线 近似 的 病例 进行 后 续 分 析 ， 
该 如 何 实现 ? 


24.1.4 ”实战 步 又 
(1) 我 们 先 分 析 一 下 ， 如 果 不 进行 匹配 ，2 种 治疗 方法 之 间 的 肺 呼 量 是 否 有 差异 ， 
打开 数据 data24.1.sav， 分 析 一 比较 平均 值 一 独立 样本 1 检验 ， 如 图 24-2 操作 ， 将 研究 效 
应 指标 肺 呼 量 放 入 “检验 变量 ” 框 ，group 放 入 “分 组 变量 ”， 并 定义 为 0，1。 点 击 “ 确 
定 ” 运 行 。 


图 24-2 ”独立 样本 1 检验 


介绍 2 独立 1 检验 的 3 步 解读 法 ， 


(2) 独立 检验 结果 ， 前面 + 检 验 部 分 已 经 详细 
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在 此 不 再 歼 述 ， 直 接 看 最 终结 果 ， 如 图 24-3 所 示 ， 太 -28.542，P-0.000<0.05， 因 此 试验 
组 与 对 照 组 治疗 效果 之 间 兰 异 存 在 统计 和 学 意义 。 然 而 ， 这 样 的 结 条 很 可 能 是 两 组 的 基线 


如 身高 、 体 重 和 胸围 不 同 导致 的 。 


组 统计 


= 慰 准 识 差 平均 
个 素数 平均 什 未 准 苦 慎 
284 2527.85 493.229 

301 3885.22 650.340 


独立 样本 检验 
莱 文 方差 等 同性 检验 ”平均 值 等 同性 t 检 验 。 
显著 性 〔 双 差 值 95% 置信 区 辣 


下 限 
-1451.519 
-1450.791 


上 限 
-1263.236 
-1263.964 


平均 值 差 什 
-1357.378 
IU -1357.378 


标 , 礁 误差 差 值 
47.932 
47.558 


假定 等 方 苦 23.053 0.000| 


0.000 
不 假定 等 方 着 


图 24-3 独立 1 检验 结果 
证 ， 继续 进行 2 独立 样本 1 检验 ， 但 此 时 比较 的 是 两 组 的 3 个 基线 指标 


(3) 基线 
之 间 有 无 差异 。 如 图 24-4 所 示 , 将 3 个 基线 指标 放 入 “检验 变量 
点 击 “和 确定” 运行 。 


” 框 ， 分 组 变量 为 (0，1) 。 


性 评分 界面 。 


将 group 放 入 组 指示 符 ， 将 3 个 基线 指标 身高 、 体 重 和 胸围 放 入 协 变量 框 用 于 校正 ; 
在 倾 句 变量 名 中 输入 一 个 新 的 倾向 性 评分 变量 ， 本 例 写 成 PS; 匹配 容 差 是 指 匹 配 的 精准 


程度 ， 取 值 范围 为 0 一 1， 越 接近 0 越 精 准 ， 越 接近 1 匹配 越 模糊 ， 建 议 初 始 值 为 0.1， 


| 第 24 章 倾向 性 评分 | 369 


然后 根据 结果 再 进行 调整 。 个 案 标 识 放 入 ID 变量 ;匹配 标识 变量 需 新 建 一 个 ， 本 例 为 
aa; 输出 数据 集 名 称 ， 新 建 一 个 为 test， 新 建 后 分 析 结 果 将 产生 一 个 新 的 数据 集 。 


组 统计 


标准 误差 平均 
值 


group 平均 慎 标 . 住 迹 
身高 。” 对 昭 组 284 158.357 5.1914 
试验 组 301 170.096 5.6149 0.3236 
对 昭 组 284 50.805 5.9409 
汪 验 301 59.482 8.4508 
对 照 组 284 80.132 7.3393 
试验 组 301 83.777 5.5381 0.3192 
独立 样本 检验 
药 立 方 鞍 等 同性 检验 平均 值 等 同性 t 检 验 
Fo—— 显著 性 ( 双 六 值 95% 置信 区 间 
t 自由 讼 尾 ) 平均 值 差 值 标准 误差 差 值 ”下 限 上 限 
身高 ” 慨 定 等 方 基 0.600 0439 0 FT 0000| -117390 0.4478 -12.6185 -10.8594 
不 假定 等 方 莽 -11.7390 0.4468 -12.6165 -10.8614 
体重 ”假定 等 方 莽 p2.518 0.000 | -14.290 583 0.000 -8.6772 0.6072 -9.8698 -7.4845 
不 假定 等 方 莽 .3 下 | 000r -8.6772 0.6013 -9.8583 -7.4960 
胸围 ”假定 等 方 盖 1.606 0.206 -6.805 583 0.000 -3.6454 0.5357 -4.6974 -2.5933 
不 恨 定 等 方 羡 -6.751 525.640 0.000 -3.6454 0.5400 -47061 -2.5846 


图 24-5 ”基线 独立 1 检验 结果 


浆 忻 [F) ”六 辑 [E) ”查看 (V) 上 惑 据 四) | 转换 人 0) 当 析 届 ) ”直销 (M) ”图形 (&) 


可 定义 变量 属性 (W).. 


一 划 设置 测量 骤 别 未 知 的 宇 息 的 测量 报 别 (L) 
ls: 上 复制 数据 属性 (C) 


Eo 上 因 新 连 定 制 属性 (B).. 


| 巴 定 交 日 期 和 时 间 (E}.. 


1 本 二 
i | 国定 义 多 重 响应 集 (MM).. 
2 的 验证 
3 齐 国 标 上 重复 个 案 U)-. 

| 加 标 识 异 党 个 案 人 0 
4 日 mR teiiB 集 (E). 
5 内 瑟 个 案 排 序 [D) 
6 局 国 放量 拓 序 @)- 

] 同 四 重 凯 - 


8 5 合并 文件 (G) t 


| 4 | 
区 
1 测 国 基文 件 调整 守 符 让 帘 度 
] 11 ] 


图 24-6 倾向 性 评分 菜单 


蛤 | 炳 向 匡 分 匹 加 | 


凸 汗 程 择 根 据 组 指 庆 符 受 行 Logistic 目 村 

姓 后 十 用 毕 成 的 本 户 变 旦 轩 沾 案 先 拌 控制 项 

止 这 程 需要 SStatistics Hegression 模块 和 Pyihon Essentials 
豆 少 需要 V1.30 上 丰 的 FUZY 扩展 十 仿 


图 24-7 倾向 性 评分 界面 设置 


(6) 选项 设置 如 图 24-8 所 示 ， 合 格 个 案 数 变量 ， 上 自己 新 建 ， 本 例 取 名 CC， 抽 样 


过 


(7) 匹配 结果 : 由 


式 选择 “不 放 回 ”; 并 勾 选 “优先 考虑 完全 匹配 ”结果 。 点 击 “ 继 续 ”“ 确 定 ” 运 行 。 
24-9 可 知 ， 模 糊 匹 配 了 83 对 数据 ， 未 发 现 精 确 配 对 的 案例 ， 


218 个 案例 没 匹 配 上 。 匹 配 设置 的 精度 值 为 0.1。 
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匹配 类 型 
完全 匹配 


抽样 


日 志文 件 


[| 抽取 匹 一 项 时 随机 排列 个 案 顺 序 后 ) 


| 随机 数 种 子 (N) : 


拭 的 倾 回 性 评分 值 软件 按照 此 值 则 


匹配 变量 


PS 


因 于 BY 列表 中 第 


址 匹配 【 键 有 效 ) 


精确 (所 有 变量 ) 


最 大 程度 地 提高 匹配 性 能 


个 案 兵制 匹配 统计 
计数 
0 
可 后 让 天 主 ) ”1 
218 
不 具有 蔡 摘 功 
能 
个 案 控制 匹配 冤 差 
模糊 匹配 尝试 次 数 。” ”说 增 拒 绝 百 分 比 
54710.000 100.000 
54710.000 99.848 


尝试 次 数 是 绘制 前 的 匹配 比较 闵 数 。 拒绝 百分比 显示 匹配 拒绝 率 。 拒绝 委 


图 24-9 ”匹配 结果 


大 家 打开 原始 数 


， 会 发 现 产生 了 3 个 变量 ， 同 上 
变量 都 是 一 样 的 ， 只 是 test 是 匹配 口 


i 数据 集 test。 如 图 24-10 所 示 ， 其 中 PS 为 计 


的 大 小 进行 匹配 ，CC 为 匹配 分 数 变量 


如 JD=30 的 “ 童 


| 平 ”， 发 现 2 个 人 和 其 PS 非常 接近 ， 软 件 随 机 选择 了 71D=352 的 个 案 与 其 进行 了 匹配 ; 


aa 变星 显示 的 数值 束 是 与 本 行 个 : 


[21D | | 名 姓名 | * group Trou 2 身高 少 体 重 j2 胸 A 
24 管 松 1 183.0 98.0|105.0 
25| 保 锐 1 165.0 52.0| 84.0 
26 张 军 1 170.0 61.0 85.0 
29 刘 立 曾 1 170.0 53.0| 77.0 
30| 章 如 平 1 170.0 54.0 79.0| 
31 李 前 前 1 166.0 7 了 2.0| 90.0 
32| 曾 献 付 1 172.0 70.0 93.0 
33 项 龙 1 |174,.0| 52.0| 78.0 


(9) 选择 匹配 后 数据 : 


们 需要 将 匹配 上 的 个 多 


(10) 匹配 后 葵 线 比较 : 

(11) 匹配 后 数据 莽 线 比较 
共 匹 配 了 83 对 数据 ， 并 且 [ 匹 配 后 数据 寺 
和 胸围 上 具有 可比 性 。 


在 高 、 体重 


荣 匹 配 的 ID。 


图 24-10 ”匹配 后 新 数据 集 


忆 为 匹配 后 的 数 # 


据 集 还 包含 一 些 未 能 匹配 上 

选 出 来 进行 统计 分 机。 请 大 家 选择 个 案 ， 让 aa 三 1， 如 图 2 24-11。 
分 析 一 比较 平均 值 一 独立 样本 t 检 3 
结果 : 如 图 24-13 所 示 ， 结 果 可 见 ， 按 照 ] ; 1 匹配 
线 比 较 ，P 均 大 于 0.05， 说 明 匹 配 后 的 数据 2 组 


WwW. , 如 图 24-12 操作 。 
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选择 


| 范围 (N.， | 
总 使 用 过 湖 变 量 (由 : 


加 过 滤 捷 未 渤 定 的 个 宰 IF) | 绑 预 则 本 宰 [PS] 
加 将 进 定 个 案 揽 制 国 新 数据 集 (O) Cc 
数据 集 名 称 (8) :| | yaa 


aa >= 1 (FILTER,) Ifil... 
总 星 除 未 选 定 的 个 案 (L) aa 由 站 


图 24-12 ”匹配 后 基线 比较 


组 统计 
平均 
group 个 案 数 平均 值 标准 差 值 
身高 ”对 晒 组 83 “162.771 5.0445 0.5537 
试验 组 83 163.982 4.4560 0.4891 
体重 。 对 照 组 83 54325 6.3575 0.6978 
试验 组 83 54241 6.5343 0.7172 
脐 围 ”对照 组 83 81.313 4.3285 0.4751 
试验 组 83 81.139 4.2234 0.4636 
独立 样本 检验 
例文 方差 等 同性 检验 平均 值 等 同性 + 检验 
显著 性 ( 双 莱 值 95% 置信 区 则 
1 自由 上 是 ) 平均 值 差 值 。 标准 误差 差 慎 “十 随 FE 
身高 ”假定 等 方 莽 0.441 0.507 | 164 0.103 -1.2108 0.7388 -2.6696 0.2479 
不 候 定 等 方 羡 | -1.2108 0.7388 -2.6698 0.2481 
体重 ”假定 等 方 董 0.001 0.975 | 0.0843 1.0007 -1.8916 2.0602 
二 很 定 等 方 羡 0.0843 1.0007 -1.8916 2.0602 
胸围 ”假定 等 方 莽 0.1747 0.6638 -1.1360 1.4854 
不 假定 等 方差 : 0.1747 0.6638 -1.1360 1.4854 


图 24-13 ”匹配 后 数据 基线 比较 结果 


(12) 匹配 后 数据 疗效 比较 : 分 析 一 比较 均值 一 独立 样本 1 检验 ， 如 图 24-14 操 
作 ， 点 击 “ 确 定 ” 运 行 ， 结 果 见 24-15， 匹 配 后 2 组 数据 方差 齐 ，t 检验 得 到 本 -11.364， 
P=0.000<0.05， 差 异 有 统计 学 意义 。 进 一 步 说 明 排除 了 身高 、 体 重 和 胸围 基线 影响 之 后 ， 
2 组 肺 呼 量 的 疗效 确实 存在 统计 学 的 差异 。 
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独立 梓 本 检验 
莱 文 方 着 等 同性 检验 平均 值 等 同性 { 检 验 
显著 性 【 双 基 慎 95 为 音信 区 间 
t 自由 度 尾 ) 平均 值 差 值 ”标准 误差 差 值 F 限 上 上限 
肺 呼 最 。” 慨 定 等 方 盖 有 mm -896.759 78.913 -1052.576 -740.942 
不 恨 定 等 方差 -896.759 78.913 -1052.604 -740.914 


图 24-15 ”匹配 后 疗效 比较 


倾 问 性 评分 匹配 是 目前 倾向 性 评分 应 用 最 广泛 的 方法 ,包括 1 : 1 匹配 和 1 : 吧 
其 中 1 : 1 较为 常用 ， 且 SPSS 目 带 PSM 模块 可 以 实现 ，1 : 六 匹配 可 以 通过 添加 SPSS 
官方 插件 ,但 过 程 复杂 ， 必 须 下 载 对 应 的 SPSS 版 本 、R、R-plugin 和 PSM 才能 安装 成 功 ， 
因此 较为 少 用 。 

知识 拓展 

(1) SPSS PSM 只 下 Matchit 的 大 部 分 功能 〈 并 非 所 有 ) 

(2) 只 能 做 更 多 组 

(3) 需要 平衡 的 因素 7 于 缺失 值 古 零 容 怒 

dll mm oben 廊下 出 错 。 

量 ， 当 样本 量 不 是 很 大 时 ， 即 使 匹配 成 功 ， 会 由 于 样本 量 较 小 


研究 目的 与 资料 类 型 选择 合 
如 果 是 二 分 类 可 以 采用 


Ce 
适 的 统计 分 析 方 法 ， 本 例 效 应 指标 为 肺 呼 量 ， 因 此 采用 1 检验 ; 
卡 方 检 验 。 
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地 24.2 PS 分 层 


24.2.1 人 简介 


上 一 市 讲解 的 倾 回 性 评分 匹配 ， 在 应 用 过 程 中 ， 
杆 本 量 束 不 大 的 情况 下 ， 会 损失 很 多 信息 ， 贪 和 性 评分 分 层 是 根据 两 组 共同 的 信和 
一 般 分 5 ~ 10 层 ， 然 后 对 每 层 数据 进行 分 析 ， 然 后 再 进行 合并 讨论 。 


性 评分 进行 分 层 ， 


24.2.2 ”案例 实战 


继续 以 data24.1.sav 为 例 ， 采 用 PS 分 层 进行 分 析 。 
(1) 首先 按照 上 述 案 例 分 析 ， 计 算出 倾 同 性 评分 (PS) 。 
(2) 选择 两 组 (试验 组 和 对 照 组 ) 共同 的 PS 范围 : 按照 组 别 group 进行 拆 分 文件 ， 
pal PS did 结果 如 下 : 发 现 两 组 PS 共同 区 间 为 0.00876 ~ 0.97303， 因 此 


& 置 如 图 24-17 所 示 。 为 了 不 影响 原始 数据 ， 产 生 一 个 新 的 逆 


据 集 test.sav。 


2 和 概率 [P3] 
二 观测 概率 【分 箱 人 6) 


描述 统计 
group EE EL 下 瑟 半 下 在 汪 


i 已 大 和 导 
对 照 组 ”预测 概率 284 | 000055 0.97303| 0.2031992 023422865 
| 
试验 组 ”预测 概率 301 0.8082772 “0.25073021 
有 效 个 案 数 (成 到 】 301 


图 24-16 ”两 组 PS 描述 分 析 结 果 图 24-17 选择 个 案 
(4) 将 test 数据 集 按照 PS 得 分 分 成 5 组: 菜单 转换 一 可 视 化 分 箱 ， 将 PS 放 入 可 视 
化 分 箱 杠 ， 点 击 “ 继 续 ”， 如 图 24-18。 点 击 “ 生 成 分 制 点 ”按钮 ， 如 图 24-19 所 示 ， 输 
入 4 个 分 割 点 ， 即 分 成 5 个 层 ， 点 击 “ 继 续 ”、“ 确 定 ”运行 
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已 扫描 赤 基 列表 过 ) : 


ses3 | 963 


DD Dr DSS O22 O30 O37 O44 DSS2 0.59 DB 0Q.74 DB 
D04 0.11 0.19 0.25 0.33 0.41 


D.S9 0O.96 C1.04 
D.33 056 0D.63 O70 DB DSS DSS3 1.00 


请 输 必 区 间 分 割 点 ?或 者 单 击 “ 生 不 分 害 碟 “上 粹 自动 创建 区 间 * 例如 :分割 点 证 10 所 
定 儿 的 区 间 起 畏 于 上 一 个 区 间 之 上 : 并 结束 于 10 


上 请 点 
入 包括 (<=) 咱 
包 排除 (=<)E) 


扫描 的 个 案 数 : 
缺失 值 : p | 


复制 分 箱 
| 从 另 一 个 变量 人 E) .| 


[到 其 他 变量 ID。 | 


0.062881 
”和 烽 305478 
”0.756641 
0.953866 


| 此 FE 一 ra | 


同 反 转 刻度 侣 ) 


本 生成 分 天 点 x 


总 竺 高 区 上 间 公 |] 
区 同 - 请 喇 少 坑 写 两 个 字 柑 
第 一 沾 信 基点 位 置 {》: 
攻 天 点 襄 (M): 
丙 度 (NN) : 


暴 后 一 个 分 割 点 位 置 : 


区 同 - i 
克 计 Im : 一 


入 基于 所 要 描 沾 这 的 平均 值 和 找 定 标准 莽 如 的 芝 坤 驻 [G 
团 + :1 行 淮 候 莽 
园 -2 行 准 筷 圭 
团 :3 行 准 候 委 
应 用 总 将 当前 分 基点 定名 替换 为 此 需 范 - 
蔓 次 区 间 属 包括 剩 汪 的 所 有 值 : NN 个 耸 训 各 将 生成 


图 24-18 可视化 分 箱 设置 


N+1 水 区 和 间 = 


图 24-19 


(5) 按照 分 层 进行 拆 分 ， 目 行 操作 ， 并 进行 每 层 的 基线 比较 : 


结果 如 图 


24-20 所 示 ， 发 现 只 有 刁 高 在 3、4、5 层 没 能 达到 均衡 ， 


分 组 依据 


及 用 独立 样本 1 检验 ， 


其 他 全 部 可 比 。 


分 成 5 


层 之 后 ， 很 多 时 候 在 两 端 会 有 极 值 的 存在 ， 比 如 本 例 1 层 ， 试 验 组 3 人 ， 对 照 组 80 人 ; 


预测 概率 【分 箱 化 ) 因 变 量 
1 身高 


体重 


脐 围 


2 身高 


体重 


驳 围 


3 身高 


驳 转 


_ 莱 文 方 弟 等 同性 检验 

由 证 F 显著 性 1 自由 度 。 
慨 定 等 方差 1.689 0197 -1.234 8 
不 假定 等 方 问 1.969 2.433 
由 定 等 方 莽 0.655 0.421 0.361 81 
不 假定 等 方 着 0.476 2.279 
由 定 等 方 革 0.063 0.803 0.494 81 
不 假定 等 方 盖 1.272 3.501 
假定 等 方 善 3.600 0.060 0.999 115 
下 假定 等 方 昔 0.815 30.564 
假定 等 方 闭 0.723 0.397 0.054 115 
下 假定 等 方 苦 0.058 2325.129 
假定 等 方 羡 0.005 0.946 0.663 1 司 
不 慨 定 等 方差 0.665 23.691 
假定 等 方 莫 D047 0.828 2.708 1 和 5 
不 程 定 等 方差 2.710 114.939 
假定 等 方 茵 2.752 0.100 0.918 半生 
下 机 定 等 方差 0.910 98.990 
假定 等 方 莫 0.763 0.384 0.499 后 
下 人 坡 定 等 方 0.495 104.533 
一 一 一 3.296 0.072 4.025 1145 
下 假定 等 方 羔 3.840 8.891 
wa 0.034 0.854 0.176 115 
下 假定 等 方 0.197 8.392 
RE 0.095 0.759 0354 115 

下 假定 等 方 0.340 7.970 
Ee 13.222 0.001 1.069 25 
下 候 定 等 方 曹 4.077 23.000 
恨 定 竺 方差 0.435 0.515 0.658 25 
不 假定 等 方差 0.485 2.241 
假定 等 方 苹 1.359 0.255 0.754 25 
不 假定 等 方 着 0.521 2.203 

图 24-20 


统计 
平均 值 等 同性 + 检验 

莱 值 95% 置信 区 同 

显著 性 ( 双 尾 ) ”5 平均 慎 羔 值 ”标准 识 差 差 值 。 ”下 限 FE 限 
0 .221 -1.1938 0 9675 -3.1188 D0.7313 
0.165 -1.1938 0.6064 -3.4046 1.0171 
0.r1g9 D0.8667 2.3986 -9057 5 6390 
0.676 0.8667 1.8225 .6.1225 7.8558 
0.623 3.3913 6.B482 -10.2444 17.0069 
0.281 3.3813 26582 -44327 11.1952 
0.320 -0.3586 0.3590 -1.0696 0.3524 
0.424 -0.3586 0.4398 -1.2745 0.5573 
0.957 -0.0758 1.4015 -2.8519 2.7004 
口 . 昌 轨 租 -0D .Or5B 1.3095 -2.1720 2.6205 
0.509 -0.7475 1.1278 -2.9814 1.4865 
0.512 -0D.rairs 1.1237 -3 引 .06BB84 1.5735 
0.7684 0.2838 -1.3305 -0.2064 
0.008 -D7684 0.2835 -1.3301 -0.2068 
0.360 0.9807 1.0679 -3.0960 1.1346 
0.365 0.9907 1.0777 -3.1191 1,.1577 
0.619 0.3996 0.8010 -1.9862 1.1871 
0.621 0.3996 0.8066 -1.9989 1.1998 
-1.5413 0.5096 -25507 -0.5319 
-1.5413 0.4014 -2.4509 -0.6317 
0.8961 D .ASB 2.6110 -站 F132 5 6306 
0.849 0.4587 2.3317 -4.8749 5.7923 

0D.r2d 0.63476 1.8023 -2.9323 4 .2075 
0.742 0.6376 1.8726 -3.6834 4.9586 
0.295 -0D.2917 0.2727 -0.8533 0.2700 
0.005 -0.2917 0.0948 -0.4877 -0.0956 
D5T7 2.7500 .1794 -5.8577 11.3577 
0.671 2.7500 5.6669 -19.2849 24.7849 
0.458 2.3333 3.0939 -4.0388 8.7054 
0.650 2.3333 4.4788 “ -15.3321 19.9988 


各 分 层 3 个 基线 指标 比较 结果 
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第 5 层 试验 组 24 人， 对照 组 3 人 ， 人 数 相差 较 大 ， 建 议 在 正式 分 析 之 前 ， 进 行 一 次 
性 分 析 ， 剔 除 一 些 可 能 的 异常 值 ， 再 后 续 分 析 结 果 可 能 会 好 点 。 当 然 数 据 
化 的 过 程 ， 本 例 仅 作 PS 分 层 的 操作 步骤 讲解 。 

本 例 虽 然 喘 高 在 各 层 未 能 全 部 达到 均衡 ， 但 已 经 明显 改善 了 基线 不 均衡 的 情况 。 当 
分 层 不 均衡 后 ， 可 以 继续 尝试 多 分 几 层 ， 但 本 例 不 再 进行 尝试 ， 大 家 自行 尝试 ， 理 论 上 
分 层 越 多 ， 可 比 性 越 强 。 

(6) 各 层 进行 试验 效应 比较 : 本 例 依 然 采 用 独立 样本 1 检验 ， 如 图 24-21 所 示 ， 结 
果 可 见 除了 1 层 差异 无 统计 学 意义 外 ， 其 他 各 层 均 发 现 试验 组 疗效 与 对 照 组 差异 有 统计 
学 意义 。5 层 总 的 试验 效应 ， 可 以 采用 meta 合并 的 方法 进行 合并 ，SPSS 无 法 操作 ， 建 
议 大 家 采用 Stata 软件 实现 。 


分 析 是 不 断 优 


独立 样本 检验 


莱 文 方 苦 等 同性 检验 平均 值 等 同性 检验 


EE 7 善 值 95% 置信 区 则 
预测 概率 (分 第 化 ) F 显 着 性 t 自由 度 ) 平均 值 善 值 ” 标准 误 闫 差 值 下 限 上 限 
1 肺 呼 最 ”假定 等 方 莽 1.490 0.226 -0.845 81 0.401 | -204.675 242.322 -686.820 277.470 
不 假定 等 方 莽 -1.904 3.025 -204.675 107.525 -545.263 135.913 
2 肺 呼 最 ”假定 等 方 莽 0.042 0.839 -6.189 115 0.000 | -806.157 130.261 -1064.179 -548.134 
不 假定 等 方差 -5.862 22.609 -806.157 137.521 -1090.912 -521.401 
了 肺 呼 最 ”假定 等 方 莽 0.222 0.639 -9749 115 0.000 | -945.871 97.019 -1138.046 -753.696 
不 假定 等 方 莽 -9.771 114.8969 -945.871 96.805 -1137.625 -754.117 
4 肺 呼 最 ”假定 等 方差 0.924 0.339 -5.592 115 0.000 | -1110.179 198.534 -1503.437 -716.921 
不 假定 等 方 闭 -6.143 8.329 -1110.179 180.727 -1524.087 -696.270 
5 肺 呼 最 ”假定 等 方 莽 2.512 0.126 -2.697 25 0.012 ‖ -970.333 359.789 “ -1711.333 -229.334 
不 假定 等 方差 -5.296 6.450 -970.333 183.208 -1411.160 -529.507 
24-21 分 层 试验 效应 比较 


二 分 类 资料 ， 则 采用 二 元 Logistic 回归 ， 生 存 分 析 资 料 ， 采 用 Cox 回归 。 


24.3.1 


人 简介 
PS 回归 就 是 把 PS 评分 当 作 一 个 协 变 量 , 代入 模型 进行 统计 分 析 ， 常 规 有 两 种 思 


> UE 


本 例 的 试验 效应 指标 肺 呼 量 为 连续 性 计量 资料 ， 采 用 的 是 1 检验 或 了 检验 ; 


如 果 为 


下 路 ， 


一 种 为 直接 代入 PS 和 研究 变量 , 另 一 种 为 代入 PS、 研 究 变量 和 重要 的 影响 变量 , 如 上 例 中 ， 


我 们 分 层 都 未 能 消除 影 啊 的 号 高 。 
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24.3.2 ”案例 实战 


继续 以 data24.1 为 例 ， 首 先 参照 如 上 计算 出 PS 得 分 。 然 后 建立 回归 分 析 。 

(1) 分 析 一 回归 一 线性 : 如 图 24-22 所 示 ， 将 肺 呼 量 放 入 “ 因 变 量 ”，group 和 预 
测 概率 (PS) 放 入 “ 块 (B) ”， 点 击 “ 确 定 ” 运 行 。 

(2) 结果 解读 : 由 图 24-23 可 知 ， 模 型 可 解释 及 方 =0.625， 模 型 检验 f=484.684， 
P=0.000<0.05， 模 型 有 意义 。Group 的 系数 为 881.188， 太 12.171，P-0.000<0.05， 回 归 系 
数 有 有 es 试验 组 平均 比 对 照 组 的 肺 呼 量 高 881.188ml。 如 果 把 对 高 一 起 放 入 作为 协 变量 
这 ， 得 到 的 结果 为 887.037mL， 相 差 不 大 。 


dit 
LL 三 二 EJ 


慰 堆 已 卉 的 误 
革 


dr.460 


A 
村 he 黄 开 | 由 FR 与 | F 显 着 性 | 兰 性 
| | 站 下 290531222.3 7 T45265611 | 14846599 Oooo 一 
焉 善 174432405.3 587 17199712037 
总 计 464963627.5 584 
3. 因 变 量 : 肺 呼 量 
b. 预测 变量 : (常量 ), group, 预测 硫 率 


选择 变量 IE) : 

I A 
咎 潜行 和 全] 未 标准 化 系数 标准 化 藉 监 

柑 型 EB 标准 误 莱 ”Bata t 显著 性 

WLS 权重 IH) : 1 (常量) 2367930 37.619 62.945 0.000 

国 [ i 
Ba 381.188 ?2.403 2 ， 
3a. 因 变 量 : 肺 呼 量 | 


图 24-22 ”线性 设置 图 24-23 ”线性 结果 


字 24.4 PS 加 权 


24.4.1 ”人 简 介 


PS 加 权 就 是 根据 计算 出 来 的 PS 评分 制定 权重 ， 然 后 再 进行 分 析 。 调 整 方 法 因 选 
择 的 目标 人 和 群 不 同 而 分 为 两 种 加 权 方 法 : 逆 处 理 概 率 加 权 (inverse probability of treatment 
weisghting，JIPTW) 和 标准 化 死亡 比 加 权 (standardized mortality ratio weighting，SMRW ) 。 

IPTW 是 以 所 有 观察 对 象 为 标准 人 群 进行 调整 ，Robins 给 出 的 加 权 系 数 (W) 计算 
方法 为 : 处理 组 观察 单位 的 权重 WWPS， 对 照 组 Wec=1/ (1-PS) ， 此 法 得 到 的 人 群 与 
原 人 和 群 数量 不 同 ， 为 得 到 与 原来 人 群 样本 量 相 同 的 标准 人 和 群 ，Herman 建议 WPWPS， 对 
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照 组 权重 Wc= (1-PD / (1-PS) ，Pt 为 整个 人 群 中 接受 处 理 因素 的 比例 。 

SMRW 是 将 处 理 组 观察 对 象 作为 标准 人 和 群 进行 调整 ，Sato 给 出 的 权重 为 Wl1， 对 
照 组 Wc=PS/ (1-PS) ， 同 样 由 于 对 照 组 得 到 的 人 群 数 与 处 理 组 一 致 ， 而 与 原 对 照 组 样本 
量 不 同 ， 进 而 调整 稳定 权重 为 WE1，Wec=[PS (1-PS) W/[ (1-PS) PH， 当 每 一 个 个 案 权 
重 计算 出 来 后 ， 就 可 以 对 每 个 个 案 加 权 后 进行 传统 的 分 析 。 


24.4.2 ”案例 实战 


继续 以 data24.1.sav 为 例 ， 演 示 采 用 IPTW 稳定 权重 系数 法 。SMRW 类 似 ， 上 自行 实践 。 

(1) 自行 分 析 ， 计 算出 PS 评分 。 

(2) 计算 P301/585=0.515， 其 中 301 为 试验 组 例 数 ， 对 照 组 为 284， 总 585 例 。 

(3) 计算 权重 《WV) ， 文 件 一 新 建 一 语法 ， 输 入 以 下 语法 程序 ， 点 击 运行 全 部 ， 即 
产生 各 目的 权重 变量 丈 值 。 


DATASET ACTIVATE 数据 集 1 

IF {group = 1) W=l1 / PS. 

IF (group = 0) W= (1-0.515) / (1-PS) . 
EXAECUTE. 


(4) 统计 分 析 : 对 个 案 按 照 丈 进 行 加 权 ， 然 后 以 group 为 分 组 ， 肺 呼 量 为 效应 指 
标 进行 独立 样本 上 检验 。 结 果 如 图 24-24 所 示 ， 可 见 厂 -21.669，P=0.000<0.05， 试 验 组 


与 对 照 组 肺 呼 量 差异 有 统计 学 意义 。 注 意 本 例 2 组 样本 量 已 经 不 再 是 585， 因 为 进行 了 
权重 加 权 。 


平均 慎 等 周 性 1 检 台 


旺 著 性 【到 荐 恒 95 驶 填 信 区间 
| 吕 者 性 自由 度 电 ) 平均 值 董 值 。 标准 误 基 苦 怕 下 到 上 限 

及 呼 最 ”假定 等 方 茎 -20.187 926 L000 -923737 45.759 -1013.540 -B33935 

二 假定 等 方 基 | -923.737 42.630 -1007.477 -B39.997 


图 24-24 加权 独 立 1 检 验 结 果 


本 例 ， 松 哥 采 用 了 倾向 性 评分 匹配 、 倾 回 性 评分 分 屋 、 倾 向 性 评分 回归 以 及 倾 回 性 
评分 加 权 4 种 方法 进行 演示 ,4 种 分 析 结 果 一 致 ， 也 相互 验证 分 析 的 准确 可 靠 性 。 近 年 来 ， 
国际 上 越 来 越 多 的 研究 者 将 倾 癌 性 评分 应 用 到 流行 病 学 、 卫 生 服 务 以 及 经 济 学 、 社 会 科 
学 等 领域 ， 和 希望 大 家 能 够 掌握 。 
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罩 啊 应 分 析 


多 重 啊 应 (Multiple Response) ， 又 称 多 选 题 ， 即 针对 同一 个 问题 同时 可 选 多 个 答案 。 
它 是 市 场 及 社会 调研 中 十 分 第 见 的 一 种 获取 被 调查 者 茶 些 特征 的 调查 形式 。 多 重 应 答 数 
据 本 质 上 属于 分 类 数据 ， 但 由 于 各 选项 均 是 对 同一 个 问题 的 回答 ， 各 选项 之 间 有 一 定 的 
相关 ， 因 此 不 宜 将 各 选项 单独 进行 分 机 。 对 于 多 重 啊 应 数据 ， 除 了 数据 录入 不 同 于 单 选 
题 数 据 外 ，SPSS 还 单列 了 “Multiple Response” 模 块 ， 在 定义 多 重 啊 应 变量 集合 (Multiple 
Response Sets) 之 后 ， 方 可 对 集合 内 各 变量 (选项 ) 进行 频数 表 和 列 联 表 的 描述 和 分 析 。 
争 例 25.1: 电信 公 et 你 使 用 过 哪些 功能 服务 ? 


a. 多 线路 使 用 .语音 邮箱 c. 寻 呼 业 务 dinternet 服务 
e. 来 电 显示 f 呼叫 等 待 g. 呼叫 转移 h. 三 方 通话 i. 电子 账单 


> 25.1 多 重 响 应 变量 定义 与 数据 录入 


数据 录入 前 ， 先 定义 变量 并 编码 变量 值 。 通 常情 况 下 ， 单 选 题 变量 的 定义 和 编码 所 
遵循 的 规则 是 : 视 题 目 为 变量 ， 选 项 为 变量 值 。 而 这 一 规则 不 适合 多 重 啊 应 。SPSS 采用 
两 种 方法 对 多 重 啊 应 变量 进行 定义 和 编码 : 多 重 二 分 法 (Multiple dichotomy method) 和 
多 重 分 类 法 (Multiple category method) 。 


25.1.1 多 重 二 分 法 


所 谓 多 重 二 分 法 , 就 是 把 多 选 题 的 每 一 个 选项 当 作 一 个 二 分 类 变量 来 进行 数据 录入 ， 
选择 定义 为 1， 不 选择 定义 为 0， 于 是 一 道 多 选 题 就 变 成 厦 干 个 变量 ， 对 于 例 25.1 共 9 
个 选项 ， 于 是 就 产生 了 9 个 (0，1) 变量 。 

针对 上 文 的 例子 ， 首 先 在 SPSS 变量 视窗 定义 变量 ， 每 个 选项 对 应 一 个 变量 。 上 例 
中 选项 中 有 9 种 电信 功能 服务 ， 于 是 定义 9 个 变量 ， 同 时 可 以 根据 需要 在 变量 标签 列 对 
变量 含义 进行 说 明 ， 如 图 25-1 所 示 。 图 25-1 中 第 六 列 是 每 个 变量 取 值 的 编码 ， 如 前 所 述 ， 
1 代表 选择 了 该 项 功能 ，0 代表 未 选择 该 项 功能 。 不 过 注意 的 是 ， 多 重 啊 应 的 这 9 个 变量 
的 取 值 编 公 及 其 含义 要 一 致 。 
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Pee 
wltline 数字 
2 voice 数字 

二 lbager 数字 
internet 数字 
| 


Ee 


internet 服 务 |{10， 
来 电 显示 
呼叫 等 待 
呼叫 转移 
三 方 通话 
电子 账单 
性 到 


5 ”callid 数字 
eallwait 数字 
了 lforward 
8 |confer 
oepill | 

10 “|gender 数字 _ 


[二 | 本 | 本 | 区 | 百 | 汪 | 盏 | 可 | 末 | 己 


| 


图 25-1 变量 视窗 


变量 定义 结束 后 ， 激 活 数 据 视窗 ， 可 以 录入 数据 。 录 入 程序 单 选 题 相 同 ， 结 果 如 
到 25-2 所 示 。 


| 而 “dtazz1saw 淫 守 于 1] -IBM SPSS Satlsilcs 国医 六 四 到 


图 25-2 多重 二 分 法 数据 录入 形式 


人 图 25-2 中 可 以 看 出 ， 每 个 变量 取 值 要 么 是 0， 要 么 是 1。 第 一 位 受 访 者 只 有 
forward (呼叫 转移 〉 这 项 服务 的 取 值 为 1， 其 他 服务 取 值 均 为 0， 表 明 第 一 位 受 访 者 只 
选 了 呼叫 转移 这 项 电信 服务 。 第 三 位 受 访 者 则 选择 了 来 电 显示 (calid)、 呼叫 等 待 (callwait) 
和 三 方 通话 (confer) 共 三 项 服务 。 

有 时候 一 个 调查 题目 有 很 多 备 选 答案 , 而 被 调查 者 最 多 只 选择 了 其 中 少数 几 个 答案 。 
此 时 ， 如 果 按 多 重 二 分 法 进行 变量 定义 、 编 码 和 录入 ， 结 果 中 大 部 分 数据 会 是 0。 由 于 
多 重 啊 应 最 后 统计 指标 是 选中 的 例 数 和 频率 , 即 统计 1 的 个 数 和 频率 , 而 0 不 在 统计 之 列 ， 
因此 过 多 的 0 除 徒 增 工作 量 外 ， 别 无 它 用 。 出 现 这 种 情况 就 不 适合 用 多 重 二 分 法 进行 变 
量 定义 和 后 续 的 数据 录入 ， 合 适 的 方法 是 多 重 分 类 法 。 


25.1.2 ”多重 分 类 法 
多 重 分 类 法 是 把 受 访 者 每 一 次 选择 作为 一 个 变量 。 具 体 实践 是 : 首先 统计 所 有 受 访 
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最 多 选择 多 少 个 答案 ， 然 后 根据 被 选 答案 数量 的 上 限 设 置 相 同 数量 的 变量 。 如 图 23-2 中 
6 位 受 访 者 〈 假 定 所 有 受 访 者 就 是 这 6 个 人 ) 选择 服务 的 数量 依次 1、6、3、0、3 和 2， 
第 二 位 受 访 者 选择 的 服务 最 多 ,为 6 项 服务 ， 也 就 是 所 有 受 访 者 选择 次 数 的 上 限 是 6 次， 
此 时 就 可 定义 6 个 变量 。 最 后 剩 下 的 就 是 变量 值 的 编码 了 。 多 重 分 类 法 变量 值 内 容 就 是 
多 选 题 的 所 有 答案 ， 只 要 对 每 个 选项 赋 个 值 。 还 是 以 图 23-2 所 示 中 6 位 受 访 者 为 例 ， 
变量 是 6 个， 假设 依次 定义 为 selectl，select2*………: select6， 这 个 题目 答案 从 多 线路 使 用 
(multline) 到 电子 账单 〈ebill) 共 9 个 答案 ， 也 就 意味 着 上 面 6 个 变量 的 值 有 9 个， 可 
依次 分 别 赋值 1，2，…9。 至 此 ， 变 量 定义 完成 。 不 难看 出 ， 从 selectl 到 select6 共用 的 
是 一 套 变量 值 编码 。 将 图 23-2 所 示 的 内 容 转化 为 多 重 分 类 法 ， 结 果 如 图 23-3 所 示 。 第 
一 位 受 访 者 只 做 了 一 次 选择 ， 即 选择 了 7， 对 应 的 内 容 是 呼叫 转移 (forward) ， 其 他 都 
是 缺失 。 


访 + 未 标题 3 [数据 集 3] - IBM SPSS Statistics 数据 篇 辑 吉 


NT(A) 


select1 | select2 | select3 | select4 | select5 | select6 | 变量 | 


7 
i 2 3 5 6 7 8 
6 6 8 | | 
5 7 3 

5 6 


图 25-3 ”多重 分 类 法 数据 形式 


实际 操作 过 程 中 ， 多 重 二 分 法 理解 相对 人 简单， 对 于 纸 质问 卷 数 据 录入 与 移动 网 络 电 
子 问卷 更 具 可 操作 性 ， 在 实际 应 用 中 使 用 较 多 。 


> 25.2 定义 多 重 啊 应 变量 


多 选 题 录 入 数据 是 把 一 题 拆 分 成 儿 道 题 进行 录入 ,数据 录入 完毕 , 在 正式 分 析 之 前 ， 
得 告诉 软件 ， 哪 些 题 是 来 目 同一 题 ， 也 就 是 合并 的 过 程 ， 叫 作 定 义 多 重 啊 应 变量 集 。 然 
后 才 可 把 所 有 变量 当 作 一 道 题目 来 分 析 。SPSS 软件 中 有 三 处 可 以 实现 多 重 响应 集 的 定义 
(图 25-4、 25-5、 25-6) ， 图 25-4 和 图 25-5 作用 一 致 ， 在 图 25-4 中 定义 ， 则 在 图 
25-5 中 可 以 查看 以 及 进行 定制 表 分 析 ; 图 25-6 中 定义 多 重 响 应 只 能 在 分 析 - 多 重 响应 进 
行 频 率 和 交叉 表 分 析 ， 在 图 25-5 中 不 能 识别 。 图 25-4 和 图 25-5 中 定义 之 后 ， 如 果 你 点 


击 保存 数据 集 ， 那 么 关闭 数据 集 后 ， 
只 能 即时 分 析 ， 


人 


合 中 的 变量 ” 框 ， 设 置 变量 的 编码 方法 ， 
量 名 称 为 “Telservices” 


框 ， 


| 
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再 次 打开 该 多 重 啊 应 集 还 会 存在 ， 而 图 25-6 定义 后 ， 
一 旦 关闭 文件 ， 坊 定义 的 多 重 啊 应 目 动 消 矢 。 


统计 分 析 功 能 上 ， 图 25-5 分 析 一 表 一 定制 表 和 图 25-6 分 析 一 多 重 啊 应 一 频率 / 交叉 
均 可 以 实现 频率 分 析 、 交 叉 表 分 析 ， 但 图 25-5 还 可 以 实现 交叉 表 的 卡 方 检验 以 及 列 
的 两 两 比较 。 因 此 图 25-5 的 功能 要 更 加 强大 一 些 。 


-| 234 设置 测量 契 别 未 知 的 宇 段 的 测量 扔 别 (L) 
上 呆 复制 数据 属性 (CG)... 


只 新 建 定制 属性 (日 )_. 
| dale 


图 25- 4 数据 一 多 重 啊 应 集 (MD) 


这 里 我 们 先 讲解 图 25-6 的 定义 方法 ， 


拓 攻 人 b) 
本 撕 述 统计 (E) 
比较 平均 值 (M) 
一 般 线 性 模型 (G) 
广 久 线性 模型 2) 


图 25-5 分 析 一 表 一 多 重 啊 应 定义 集 (S) 


数据 集 data25.1.sav。 


(1) 分 析 一 多 重 响应 (U) 一 定义 变量 集 (D) ， 如 图 2$-7 所 示 , 将 9 个 选项 放 入 “ 集 


则 定义 成 功 。 


Te 


直销 (M) 图形 丛 ) ”实用 程序 (UJ) ”扩展 (X) 窗口 


缠 有 国人 蛤 定 久 刘 重 响应 集 
[ 避 
met&callid 


U 
1 
1 
U 
] 
1 
0 
] 


报告 (P) 

描述 统计 伍 ) 

表 ( 昌 ) 

比较 平均 值 (M) 
一 般 线 性 模型 (G) 
广义 线性 模型 (2) 
况 合 模型 (X) 

人 相关 伺 ) 

四 扫 依 ) 

对 数 线 性 ( 吕 ) 
分 类 人) 

降 维 (D) 

标 度 (AA) 

非 戎 数 检 验 (N) 
时 间 序 列 预 市 (T) 
生存 分 析 (S) 


i 


图 25-6 分 析 一 pee (D) 


达 性 3 [gender] 


态 二 分 法 侣 ) 计数 值 (0) : 


: 请 使 用 “数据 * 蔡 单 中 的 “ 定 必 多 和 章 响应 集 ”* 


图 25-7 定义 多 草 啊 应 集 对 话 框 


本 例 为 二 分 法 ， 计 数值 为 1， 定义 多 重 响应 变 
， 标 签 为 “电信 服务 ”， 点 击 右 侧 的 “添加 ”按钮 后 ， 


关闭 对 诺 


总 音响 应 斥 (3) 


注 : 此 个 定 必 的 集 辣 代 在 “之 重 响应 频率 “和 和“ 癌 重 响应 贸 表 “ 这 程 中 可 用 。 哮 于 要 在 其 他 位 置 使 用 
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(2) 如 果 变 量 定 义 采 用 多 重 分 类 法 ， 定 义 多 重 啊 应 变量 集 方 法 和 上 面 步骤 一 致 ， 唯 
一 的 不 同 是 在 “将 变量 编码 为 ”下 面 选择 “类 别 〈《G) ”， 并 “范围 ”指定 变量 值 起 止 值 ， 
如 图 25-8 所 示 。 


图 25-8 多重 分 类 法 定义 多 重 啊 应 集 参 数 设置 


> 25.3 不 定 项 多 选 题 频率 描述 分 析 


任意 多 选 题 是 指 可 以 根据 被 试 人 的 情况 任意 选择 ， 如 上 例 9 个 备 选 答案 ， 被 试 人 可 
以 选择 0 一 9 个 答案 。 继 续 借 用 data25.1 中 引 例 来 分 析 ， 该 数据 是 SPSS 目 带 文件 (SPSS 
根 目录 \Samples\Englishvtelco.sav) 部 分 数据 ， 数 据 格式 如 图 25-1 所 示 。 定 义 完 成 之 后 可 
以 直接 进行 分 析 。 

(1) 分 析 一 多 重 响应 〈U) 一 频率 ， 如 图 25-9 所 示 ， 将 多 重 响应 变量 集 放 入 “ 表 ” 
中 ， 点 击 “ 确 定 ” 即 可 。 

(2) 结 果 解 读 , 图 25-10(A), 个 案 摘 要 告诉 我 们 有 多 少 缺失 值 , 发 现 111 个 个 案 缺 失 ， 
实际 有 效 个 案 889 个 ; 图 25-10(B) 为 电信 服务 的 频率 分 析 ， 啊 应 个 案 数 为 选择 该 选项 
的 人 数 ， 啊 应 百分比 为 选择 个 案 数 除 以 共计 啊 应 个 案 数 3740， 个 案 百 分 比 是 啊 应 个 案 数 
除 以 实际 有 效 个 案 数 889。 对 于 啊 应 百分比 和 个 案 百 分 比 ,， 个案 百 分 比 更 具 专 业 的 意义 。 
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有 效 扶 失 总 计 


个 素数 日 分 比 个 素数 日 分 比 个 素数 日 分 比 
$TelserviceSs 889 88.9% 111 11.1% 1000 100.0% 


a. 司 用 了 慎 1 对 二 分 组 进行 制 表 。 


$Telservices 顾 屁 


多 重 响 应 集 (M) Ei 
个 案 数 百分比 个 案 百 分 比 
电信 服务 ” 多 线路 使 用 475 12.7% 53 .4 台 
语音 邮箱 304 98.1% 34.2% 
寻 呼 业务 261 7.0% 29.4% 
internat 服 务 468 9.8% 41.d 台 
来 电 显示 481 12.9% 54.1 允 
Ey | 呼叫 等 待 485 13.0% 54.6% 
-缺失 值 呼叫 转移 493 13.2% 55.5% 
在 二 分 集 内 成 列 排除 个 案 亿 ) 三 方 通话 502 13.4% 56.5% 
在 类 别 内 成 列 排除 个 案 (G) 电子 账单 371 9 .9% 41.7 听 
总 计 3740 100.0% 420.7% 
a. 使 用 了 值 1 对 一 分 组 进行 制 表 * 
图 25-9 多重 啊 应 频率 分 析 图 25-10 个 案 摘 要 与 频率 


也 25.4 不 定 项 多 选 题 频率 过 腊 卡 万 检验 


不 定 项 多 选 题 频率 差异 卡 方 检验 又 称 为 题 项 适合 度 检 验 。 对 于 图 25-10 多 重 啊 应 变 
量 频 率 表 ， 构 建 一 个 新 的 数据 库 ，data25.2_ sav。 
(1) 打开 数据 data25.2， 数 据 一 个 案 加 权 ， 对 频数 进行 加 权 ， 如 图 25-12 所 示 。 


上 data23.2say 四 舌 伟 着 - 忆 M Sp55 Statistics 对 舌 握 可 器 = 
充 件 {E) 寺 输 三 可 看 站 数 疾 辐 ) 特 措 并) 从 析 侈 | 站 畏 出 i 攻 玲 t6) 实用 程序 出 扩 民 多) 窗口 圳 | 用 助 [Hk 
所 ee 本 四 民 


名 不 对 个 案 加 权 {D) 
辐 个 案 加 权 系 数 (WY) : 
re -一 贡生 :过量 [ 


当前 状态 : 个 案 加 权 产 数 : 频 糙 


图 25-11 新 建 数 据 库 图 25-12 个 案 加 权 


(2) 分 析 一 非 参 数 一 旧 对 话 框 一 卡 方 ， 如 图 25-13 所 示 ， 将 考虑 因素 放 入 检验 变量 
列表 ,期望 值 根据 目 己 检验 的 目的 设置 ， 本 例 选择 “所 有 类 别 相等 ”， 扣 击 “ 确 定 ” 运 行 。 
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期 请 范围 EA | 

加 从 数据 中 获取 (G) | 加 所 有 类 别 相 等 山 和 @ 

加 使 用 指定 范围 但) | 全 Ww: | 
TPR): 


上 恨 届 ): 


图 25-13 ” 非 参 数 卡 方 检验 


(3) 结果 解读 ， 如 图 25-14 所 示 ， 按 照 所 有 类 别 相等 ， 期 望 个 案 3 
拟 合 优 度 卡 方 ， 如 图 25-15 所 示 ， 卡 方 值 为 160.480，P=0.000<0.05， 因 
的 被 选择 的 比例 之 间 差 别 有 统 计 和 学 意义 。 


者 席 因 束 
瑞 测 不 来 政 ” 风 蕊 不 素 政 ”” 茂 芭 

名 线路 使 用 475 415.6 59 .4 
语音 邮箱 304 4156 -111.6 
寻 呼 业务 261 4156 -1546 检验 统计 
-es Sa 
二 | 上 条 160. 4807 
吓 hl 符 特 485 415.6 69.4 z 
呼叫 转 移 493 415.6 77.4 目 由 度 8 
三 方 通话 502 415.6 86.4 新 近 下 者 性 0.000 
电子 帐 间 371 4156 -44.6 a. 0 个 单元 格 (0.0%) 的 期 莒 频率 低 于 
总 计 3740 5 = 期 忒 的 最 低 单元 格 屯 认为 415.6 。 

图 25-14 ”频率 分 析 图 25-15 卡 方 检验 


> 25.5 不 定 项 多 选 题 交 义 表 分 析 


如 条 想 了 解 其 他 不 同 变量 对 该 多 重 啊 应 变量 的 影响 ， 如 不 同性 别 和 年 龄 对 电信 服务 
选择 种 类 的 影响 , 可 以 使 用 交叉 表 进 行 分 析 。 例如 ,本 例 希 望 分 性 别 进行 考察 , 操作 如 下 。 
(1) 分 析 一 多 重 啊 应 (U) 一 交叉 表 〈C) ， 如 图 25-16 所 示 ， 将 性 别 “gender” 放 入 行 ， 
并 定义 光 围 (0，1) ， 列 放 入 刚才 定义 的 多 重 啊 应 集 $Telservices。 

(2) 选项 设置 如 图 25-17 所 示 ， 根 据 上 自己 的 研究 目的 ， 行 百分比 、 列 百分比 ; 个 
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案 百 分 比 与 响应 百分比 。 


蝎 ) 语音 邮箱 [voice] 
秽 ) 寻 呼 业务 [pager] 
碟 y internet 服 务 [inter 
忆 来 电 显 示 [callid] 
看 呼叫 等 待 [callwaiil] 


加 可 中 I TT 
at 在 响应 集 之 间 匹 配 变量 {MM) 


磺 电子 账单 [ebill = | Fa 
图 个案 (8) @ 响应 IR) 


况 章 响应 焦 伞 ) 


住 二 分 集 内 上 处 列 排 际 个 订 {E】 
和 在 类 别 内 成 到 排 际 个 率 人 0 


图 25-16 多 响应 交叉 表 对 话 框 图 25-17 ”选项 设置 


主要 结果 解读 

个 案 摘要 的 结果 同 前 ， 所 示 给 出 了 有 效 数 据 和 缺失 数据 的 基本 信息 。 本 例 中 1000 受 
访 者 中 的 111 人 被 划 为 缺失 ， 实 际 上 是 111 人 没有 选择 任何 电信 服务 。 图 25-18 为 交叉 
表 分 析 结 果 。 单 元 格 内 显示 的 是 使 用 各 种 服务 的 男女 人 数 以 及 以 受 访客 户 数 为 基数 列 百 
分 比 。 多 线路 使 用 与 男性 交叉 的 单元 格 内 ，224 是 使 用 此 项 服务 男性 人 数 ，51.7% 为 使 用 
此 项 服务 的 男性 占 总 个 男性 人 数 的 百分比 。 


个 素 摘 去 
A 有 效 让 先 总 计 
”不 素数 百分比 ” ”个案 数 百分比 个 素数 ”” 百 分 比 一 
gender*$Telservices 交叉 表 
电信 服务 
多 线路 使 用 ”语音 邮箱 寻 呼 业务 internet 服务 “来电 显示 ”呼叫 等 待 ”呼叫 转移 ”三 方 通话 ”电子 账单 总 计 

性 别 Male 计数 224 143 133 1 7 过 昌吉 242 241 Jd 193 4343 

占 gender 的 目 分 比 51.7 折 33.0% 30.7% 40.0% 53.6% 55.9% 57.0% 56.1% 42.3% 

占 $Telsemvices 的 百分比 47.2% 47.0% 51.0% 47.0% 48.2% 49.9% 50.1% 4 日 .4 49.3% 
Female ” 计 监 251 161 128 195 249 243 246 259 188 456 

占 98nder 的 上 自分 比 550% 9 .4 史 28.1% 42.8% 4.6% 63% 634.9% 56.8% 41 ,2% 

占 $Telsemvices 的 百分比 52.8% 53.0% 49.0% 53.0% 51.8% 50.1% 49.9% 51.6% 50.7% 
总 计 计数 475 304 261 368 481 485 493 502 371 889 


百分比 和 总 计 基 于 响应 者 。 
a. 使 用 了 值 1 对 二 分 组 进行 制 表 ， 


图 25-18 ”男女 各 种 电信 服务 的 频率 
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史 25.6 不 定 项 多 选 题 交 义 表 卡 方 检验 


上 和 节 所 述 方法 只 能 得 到 交叉 表 的 摘 述 性 分 机 ， 如 宁 想 知道 男女 不 同性 别 选 择 电 信服 
务 构成 有 没有 关 别 ， 则 需要 通过 如 下 方式 进行 分 析 。 

(1) 分 析 一 表 一 多 重 响应 集 (S) ， 按 图 25-19 所 示 操 作 ， 定 义 多 重 啊 应 集 ; 将 9 
个 电信 服务 项 目 放 入 “和 集合 中 的 变量 ” 框 ; 编码 方法 为 二 分 法 , 计数 为 1 定义 集合 名 称 后 ， 
添加 入 “多 重 啊 应 集合 (S) ” 框 。 

(2) 分 析 一 表 一 定制 表 ， 操 作 如 图 25-20 所 示 。 


| 此 总 定义 的 集 诗 在 " 考 重 响应 二 字 "和 "党 重 
| 上 到 内 表 “过 粒 中 十 可 用 


| 
= 多 重 响 应 集 全 全) 


is: | 1 半天 一 


分 析 避 ) 直 畏 (IM) 图 形 (从 ) 实用 程序 (U) ”扩展 CX) 窗 
站 ”报告 (P) } 并 和 E33 EE | 
描述 统计 [EE) | 丝 引 加 国 时 
表 (B) =: 


比较 平均 值 (M) j a ( 
一 航线 性 模型 (G) ”| 国 定义 尖 顺序 
| 广义 线性 模型 es 


图 25-19 定义 多 重 啊 应 集 图 25-20” 表 一 定制 表 


(3) 定制 表 设 置 : 如 图 25-21 所 示 ， 展 示 方 式 包 括 香 规 、 款 次 和 层 ， 个 人 喜好 选择 
“这 竣 型 ”。 将 “电信 服务 ” 放 入 列 ，“ 性 别 ” 放 入 行 。 

(4) 检 验 统 计 设 置 , 如 图 25-22 所 示 , 选择 独立 性 检验 ( 卡 方 )(T), 同时 为 了 比较 列 ， 
即 9 个 电信 和 服务 之 间 有 无 着 民 ， 和 选择 “比较 列 比例 ”， 并 选择 Bonferroni 校正 。 

主要 结果 

到 25-23 (A) 为 性 别 与 电信 服务 的 交叉 表 ; 图 25-23 〈B ) 为 交叉 表 卡 方 检验 结果 ， 
卡 方 值 为 4.666，P=0.862>0.05， 说 明 不 同性 别 在 电信 服务 选择 上 差异 无 统计 学 意义 。 图 
25-23 (C) 为 列 水 平 的 两 两 比较 ， 因 为 本 例 并 未 及 现 兰 开 有 统计 学 是 义 ， 因 此 ， 列 比 轻 
也 没有 发 现 有 差异 的 项 目 。 为 了 让 大 家 能 够 理解 ， 如 果 有 差异 ， 结 果 将 如 何 展示 ， 松 哥 
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题 项 C 和 了 D 之 间 关 开 有 统计 学 意义 。 


| 列 平 均 悄 和 列 | 比 十 
条 经 陆 使 用 mui | 有 EE 
Rn 本 1 i 本 确证 品 特 性 鞋 导 
本 intarnet 服 入 [nisr. | 川 | | 5 | ee “对 于 和 多重 响应 过量 男 显示 显 车 性 展 反 ) 
病 平 电 呈 示 [calid || Ns | | 全 在 主 表 中 借 
议 旦 叫 竺 [calwal De ET :| Bn 


oo co | | 2 由 | 总 基 性 水 平 (G) 贺 调整 p 俏 以 诺 行 才 重 比较 [J | 
本 性 中 [genden ee re 剖 邦 非 亿 尼 (9) 站 BenjaminHiochbeig 


日 电信 服务 [STelsar | | 和 [a ， 


| 园 信用 小 计 代 替 小 计 2ERUD) 
转 将 半生 山 匹 变量 包括 在 裕 星 中 诈 


人) - 卡 讽 和 3U 比 全 | 术科 汪 用 于 行 和 BU 中 都 存在 党 类 变量 的 家 = 
- 列 平 均 信 恰 验 汪 用 于 和 中 存在 标 度 变量 耐 列 中 存 往 学 党 变 且 的 表 * 
- 对 于 过 拓 由 至 秆 出 其 后 淹 表 淮 度 和 直 '， 秆 会 扫 人行 答 驻 *“ 


司 隐 党 则 )】 当中 位 置 伍 ) : - 淆 修 所 有 有 皖 百 中 潜 队 总计- 促 当 :小 计 所 适用 的 类 出 由 于 仿 焙 状 六 或 者 已 车 上 广 刘 行 指定 ， 填 会 康 用 小 
eh Pee 人 
- 交 从 时 芹 性 检验 中 乒 了 已 计 租 汪 | 


图 25-21 定制 表 设 置 图 25-22 检验 统计 设置 


电信 服务 
省 多 站 路 使 用 ”语音 邮箱 “ 寻 呼 业 务 ”internet 服 务 ”来电 显示 ”呼叫 等 待 ”呼叫 转移 ”三 方 通话 ”电子 账单 
计数 计数 计数 计数 计数 计数 计数 计数 计数 
性 别 Male 224 143 133 173 232 242 241 243 183 
Female 251 161 128 195 249 243 246 259 188 
日 | 皮尔 更 卡 方 答 验 
空 行 和 列 。 
列 比 例 的 比较 
电信 服务 
© 多 闭路 使 用 “话音 邮箱 和 寻 呼 业务 。 internet 服务 ”来电 显示 ”呼叫 等 待 ”呼叫 转移 三方 通话 ”电子 账单 
(A (B) (C) (D) (E) (F) (G) (H) 山 
性别 Male 
Female 


结果 基于 双人 删 检 强 。 对 于 每 个 显 者 对 ， 列 比例 较 小 的 类 列 的 键 出 现在 列 比例 较 大 的 类 别 之 中 
大 写字 母 (A， 日， CC) 的 显著 性 水 平 : 0.05 


a. 通过 使 用 Bonferroni 校正 法 : 检验 将 针对 每 个 最 内 部 子 表 的 一 行 中 的 所 有 成 对 比较 进行 调整 * 


图 25-23 ”定制 表 - 卡 方 检验 结果 
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到 比例 的 比较 
$ 考 虚 因 素 


结果 基于 双 侧 检 又 于 下 每 个 显著 对 , 列 比例 较 小 的 类 刚 丽 寺村 
现在 列 比 例 较 太 的 类 别 之 中 。 
大 写字 有 母 (A.B 、 C1 的 显著 性 水 平 : 0.05 
a. 通过 使 用 Bonferroni 校正 法 :检验 将 针对 每 个 最 内 部 子 表 
的 一 行 中 的 所 有 成 对 比较 进行 调 向 : 


图 25-24 列 比例 的 比较 结果 


多 选 题 分 析 中 ， 最 常见 的 就 是 不 定 项 多 选 题 ， 还 包括 定 同 多 选 题 、 排 序 题 和 选择 排 
序 题 ， 这 些 更 多 与 问卷 统计 相关 ， 松 哥 将 在 问卷 统计 专著 中 详细 讨论 。 


日 今 > 种 26 章 一 致 性 分 析 


在 试验 性 研究 中 ， 很 多 的 时 候 ， 我 们 期 待 的 结果 是 发 现 组 间 差 异 具有 统计 学 意义 ， 
然而 在 医疗 器 械 以 及 体外 诊断 试剂 研究 中 , 我 们 期 待 的 是 差异 无 统计 学 意义 , 为 什么 呢 ? 
因为 待 评价 的 医疗 器 械 或 者 诊断 试剂 是 与 标准 医疗 器 械 或 者 金 标准 比较 ， 如 果 P>0.05， 
就 有 理由 认为 待 评 价 器 械 或 者 诊断 试剂 与 标准 组 差异 无 统计 学 意义 ， 具 有 检测 结果 的 一 
致 性 ， 进 一 步 也 就 说 明 待 评价 的 器 械 或 诊断 试剂 就 可 以 蔡 代 标准 器 械 或 者 金 标 准 诊断 方 
法 了 。 犹 如 统计 分 析 发 现 你 和 你 们 主任 看 病 水 平 差 异 无 统计 学 意义 ， 你 说 你 笑 不 ， 说 明 
你 水 平 已 经 达到 主任 的 水 平 啦 。 所 以 ， 与 好 的 比 ， 要 无 统计 学 意义 ， 与 差 的 比 ， 一 定 要 
有 统计 学 意义 。 

其 实 一 致 性 分 析 所 用 到 的 方法 基本 都 是 前 面 介绍 过 的 方法 ， 只 不 过 围绕 一 致 性 这 个 
主题 凝聚 到 一 起 , 方便 有 这 方面 需求 的 人 员 学 习 ! 同时 因为 一 些 方法 前 面 已 经 详细 解读 ， 
此 处 则 会 从 略 ， 涉 及 的 新 方法 会 重点 实战 。 


> 26.1 定性 资料 一 致 性 评价 


26.1.1 ”配对 四 格 表 ( 有 人 金 标 准 ) 


表 26-1 为 ECG 诊断 试验 结果 ， 其 对 比 检测 为 心肌 梗死 是 否 出现 ， 为 金 标准 。 因 此 
是 用 金 标准 来 检测 ECG 诊断 的 效果 。 因 此 该 例 为 诊断 试验 的 评价 ， 请 大 家 参见 ROC 曲 
线 章节 。 但 对 于 一 致 性 的 评价 ， 应 该 进行 Kappa 一 致 性 检验 ， 当 不 符合 对 称 性 ， 还 要 进 
行 加 权 Kappa 检验 。 将 数据 构建 到 数据 库 data26.1.sav， 分 析 如 下 。 


表 26-1 ECG 诊断 试验 结果 


心肌 梗死 ( XG ) 
ECG 诊断 结果 - : 合 计 


(1) 个 案 加 权 : 如 图 26-1 所 示 ， 数 据 一 个 案 加 权 ， 将 频数 项 freq 放 入 “个 案 加 权 系 
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数 ” 杠 ， 点 击 “ 确 定 ”。 


(2) 卡 方 检验 : 分析 一 描述 性 统计 一 交叉 表 ， 如 图 26-2 所 示 ， 将 “ECG” 放 入 “ 行 ”， 
“XG” 放 入 “ 刚 ”， 凤 击 “ 统 计 ”， 如 图 26-3 所 示 ， 义 选 “Kappa” 和 “McNemar”。 


屋 1 


We st 


村主 志 展 中 显示 层 变 胜 届 ) 


下 未 族长 攻 形 图 蚂 ) 
排队 于 记 ) 


图 26-1 加 权 个 案 图 26-2 ”交叉 表 设置 


(3) 结果 解读 : 本 例 McNemar 卡 方 ， 也 就 是 配对 四 格 表 卡 方 P=0.345， 说 明 两 种 
检测 方法 间 的 差异 无 统计 学 意义 。 一 致 性 Kappa 检验 ，Kappa=0.949，P=0.000<0.05， 说 
明 Kappa 值 与 0 比较 差异 有 统计 学 意义 ， 意 即 Kappa 值 的 一 致 性 是 真实 存在 的 ，Kappa 
取 值 0 一 1， 越 接近 1 越 好 ， 一 般 大 于 0.8， 则 认为 一 致 性 较 好 。 


卡 方 检验 
Fi 相关 性 (R) 全 人 
和 多 入 启 


一 值 一 《 观 制 ) 
下 联 褒 堵 [ 口 ) Gamma 
Phi 和 和 O 克 黑 坊 W 萨 拷 革 | dS) 
Lambda 肯 德 冰 tau-b 
不 确定 性 闲 数 (UI) 肯 德 汪 tau-e 


网 Kappa 对 称 测 量 
新近 标 在 识 车 3 


柯 克 兰 和 毗 特 尔 - 享 塞 尔 统 计 (A) 
检验 一 般 比 值 比 等 于 [) : | 


图 26-3 ”统计 设置 


a. 未 假定 原 候 设 
b. 在 假定 原 假 设 的 情况 下 使 用 前 近 标 准 误 差 。 


图 26-4 ”统计 结果 
26.1.2 ”配对 四 格 表 (无 金 标准 ) 


当 用 两 种 方法 进行 检测 ， 但 两 种 方法 均 不 是 金 标准 时 ， 则 不 能 称 为 诊断 试验 ， 诊 断 
试验 中 的 一 种 方法 必须 是 金 标准 或 者 行业 认可 的 方法 。 那 么 此 时 进行 评价 则 只 能 评价 其 


阳性 一 致 性 百分比 ， 阴 性 一 致 性 百分比 ， 总 体 一 致 性 百分比 及 各 目 可 信 区 间 ， 以 及 计算 
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Kappa 值 。 


表 26-2 考核 试剂 与 参 比试 剂 的 检测 结果 


参 比 试剂 
考核 试剂 阳 性 


338 
1010 例 样本 用 参 比 试剂 和 考核 试剂 分 别 检测 结果 的 阳性 符合 率 、 阴 性 符合 率 和 总 符 
合 率 及 其 95% 置信 区 间 ， 分 析 结 果 见 表 26-3 所 示 。 
阳性 符合 率 =323/338=0.9556 
阴性 符合 率 =667/672=0.9926 
总 符合 率 = (323+667) /1010=0.9802 
然后 按照 率 的 95% 可 信 区 间 方 法 计算 各 目的 95% 可 信 区 间 。 率 的 95%CI: PP 土 
1.96sp，sp 为 率 的 标准 误 ，sp=sqrt (p* (1-p)/n) ， 结 果 见 表 26-3。 


表 26-3 ”考核 试剂 与 参 比试 剂 的 符合 率 


同时 参照 案例 1 的 方法 ， 计 算得 Kappa= 0.955>0.8，P-=0.000<0.05，95%CI: 0.9358 一 
0.9746， 表 明 考 核 试剂 与 参 比试 剂 两 种 检测 方法 ， 检 测 结 果 有 高 度 的 一 致 性 。 


26.1.3 ”等 级 资料 RxC 表 一 致 性 评价 


两 种 方法 检测 某 种 疾病 ， 结 果 见 表 26-4， 结 果 可 见 为 等 级 资料 ， 可 以 采用 Kappa 一 
致 性 评价 ， 方 法 同上 此 处 不 歼 。 


表 26-4 两 种 方法 对 疾病 检测 结果 比较 
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-> 26.2 料 一 致 性 评价 


26.2.1 ”配对 1 检验 


配对 1 检验 主要 检验 的 是 两 种 方法 检测 结果 的 系统 误差 是 否 有 差别 ， 但 不 能 检验 随 
机 测量 误差 。 方 法 参见 前 面 1 检 验 章节 ， 当 检验 P>0.05 时 ， 可 以 认为 两 种 方法 检测 结果 
一 

26.2.2 ”了 Pearson 相关 系数 

用 于 检测 2 组 定量 检测 指标 线性 相关 关系 的 密切 程度 ， 而 非 一 致 性 。 只 有 当 相 关 
系数 为 1 时 ，2 组 资料 才 存 在 绝对 线性 关系 ， 注 意 相 关系 数 检 验 的 书 值 大 小 与 相关 性 的 
强 弱 无 关 ， 只 反映 相关 系数 是 否 真 实 存在 。 相 关系 数 + 要 大 ， 一 般 要 求 r>0.975， 并 且 
P<0.05， 认 为 存在 高 度 的 相关 性 ， 参 考 相 关 分 析 章 节 ， 此 处 不 装 。 

26.2.3 组 内 相关 系数 ( Intra-class correlation coe 人 cients ，ICC ) 

ICC 用 于 检测 不 同 测量 方法 间 变异 占 总 变异 的 比例 , 对 系统 误差 和 随机 误差 均 敏感 


ICC 值 越 大 ， 表 明 两 种 检测 方法 测量 的 差别 的 系统 误差 与 随机 误差 均 较 小 ， 数 据 的 一 致 
性 较 好 ， 判 断 标 准 为 XCC>0.7， 当 样本 量 较 少 时 ，7CC 会 被 低估 。 


案例 实战 
某 研究 者 采用 3 种 仪器 对 10 份 样本 进行 检测 ， 试 分 析 3 种 仪器 检测 结果 的 一 致 性 。 
将 表 26-5 数据 构建 为 数据 库 data24.2.sav。 


操作 步骤 
(1) 打开 数据 data26.2。 分 析 一 标 度 一 可 靠 性 分 析 ， 如 图 26-5 所 示 ， 将 仪器 1 一 3 
放 入 项 目 框 。 
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(2) 统计 设置 : 反击 “统计 ”, 如 图 26-6 所 示 ， 勺 选 “同类 相关 系 效 ”， 模 型 选择 “ 双 
问 混 合 ”， 关 型 “选择 绝对 一 致 ”。 


中 平均 值 (M) 
加 | 方差 W) 


加 | 协 方差 (0) 
相爱 性 (B) 


图 26-5 可靠 性 分 析 图 26-6 统计 设置 


此 处 模型 包括 单 问 随机 、 双 回 随 机 和 双 回 混合 。 当 仅 考 虑 测量 对 象 之 间 的 变异 ， 不 
考虑 测量 仪器 〈 或 者 不 同 评价 者 ) 之 间 的 变 民 时， 选择 单 回 随机 ， 当 既 考虑 测量 对 象 之 
间 的 变异 ， 又 考虑 测量 方法 之 间 的 变异 时 ， 选 择 双 回 随机 当 考 虑 测量 对 象 之 间 的 变异 ， 
但 测量 仪器 为 固定 因 系 时 ， 选 择 双 同 泥 合 。 本 例 受 试 对 象 10 人 ， 应 该 为 所 有 符合 党 试 对 
象 的 一 个 随机 样本 ， 故 测量 对 象 随 机 ， 而 检测 仪器 为 3 种 ， 而 且 评 价 结果 仅 在 这 三 种 仪 
铬 间 比 较 ， 因 此 为 固定 ， 故 本 例 选择 双 同 混合 。 

类 型 选择 包括 一 致 性 和 绝对 一 致 ， 一 致 性 仅 考 虑 趋势 一 致 ， 绝 对 一 致 考虑 数 
对 一 致 ， 本 例 选 绝对 一 致 。 

(3) 结果 解读 ， 如 图 26-7 所 示 ，ICC 结 采 包括 单个 测量 与 平均 测量 ， 本 例 看 单个 
测量 ，1ICC=0.882，P=0.000<0.05， 一 致 性 较 好 ， 一 般 TICC>0.7， 即 可 认为 具备 较 高 的 一 
致 性 。 当 每 个 受 试 对 象 的 检测 值 由 单个 仪器 《或 单个 评价 者 ) 检测 得 出 ， 选 择 单个 测量 ; 
当 受 试 对 象 的 检测 值 由 多 个 评价 者 给 出 时 ， 选 择 平 均 测 量 ， 如 研究 生 复试 ， 某 个 研究 生 
的 复试 成 绩 由 多 个 评分 者 打分 的 均值 构成 。 结 果 中 的 科隆 巴赫 a 系数 ， 为 信 度 分 析 内 容 ， 
参见 相关 章 市 。 


据 的 绝 
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可 靠 性 统计 


Alpha 项 几 


0.953 3 


同类 相 估 系数 
35 和 前 信 区 则 使 用 真 值 0 的 F 检验 
同类 相关 性 ? 焉 限 上 限 慎 自由 度 1 自由 度 2 是 敬 性 
一 


nT 
a. 无 论 是 否 存 在 交互 效 这 :， 估算 量 均 相 同 。 
b. 使 用 绝对 协议 定义 的 A 业 同 类 相 估 系数 。 
c. 此 估算 在 贝 定 不 存在 交互 效应 的 情况 下 进行 计算 ， 理 则 无 法 估算 。 


26-7 ICC 结果 


26.2.4 Bland-Altman 法 


该 法 是 定性 与 定量 方法 的 结合 ， 可 以 较 好 地 评价 定量 结果 之 间 的 一 致 性 ， 可 以 同时 
控制 系统 误差 和 随机 误差 。 计 算 一 致 性 的 限度 作为 评价 一 致 性 指标 。 设 Dr 灰 〈 两 者 
均值 之 差 ) ，4= (Xt 各) /2《〈 两 组 均 数 的 均 数 ) ， 绘 制 刀 与 4 散 点 图 ， 探 查 刀 与 4 之 
间 的 关系 。 如 果 DD 与 4 不 相关 ， 则 做 出 Bland-Altman 图 ， 看 差 值 D 的 95% 范围 是 否 落 
在 DD 土 1.96S 范围 内 ， 同 时 D 土 1.96S 应 该 在 专业 容许 的 范围 但 D 与 4 相关 ， 则 需要 做 
D=a+pB+ 随机 误差 ， 检查 a，p 是 否 有 统计 学 意义 ， 当 a 和 0， 说 明 两 种 检测 结果 具有 
一 致 性 。SPSS 也 可 以 通过 目 己 手动 编辑 的 方式 实现 ， 但 过 程 复 杂 ， 此 处 用 Medcalc 软件 
讲解 。 

案例 实战 

采用 多 次 屏 气 电影 法 MRI (mEDV) 和 单 次 屏 气 电影 法 (SEDV) 检测 16 名 心 功 能 
指标 左 心室 舒张 末期 容量 (EDV) ， 数 据 见 data26.3.sav， 试 进行 两 种 方法 的 一 致 性 评价 。 

(1) 打开 Medcalc 软件 ， 文 件 一 打开 ， 选 择 数 据 文 件 类 型 .Sav， 找 到 data26.3 打开 ， 
如 图 26-8 所 示 ， 选 择 ALL-OK。 

(2) 分 析 : statistics-Method comparison- Bland & Altman plot。 

(3) Bland & Altman plot 设置 : 如 图 26-10 勺 选 ， 可 以 做 差 值 图， 差 值 百 分 比 图 和 
比例 图 三 种 ， 根 据 目 己 专业 需要 选择 ， 本 例 选 择 关 值 图 。 

(4) 结果 解读 : 结果 如 图 26-11 所 示 ， 可 见 仅 16 个 点 中 ， 只 有 1 个 超出 95% 范围 ， 
总 体 一 致 性 较 好 。 
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图 26-8 ”选择 变量 图 26-9 B-A 步骤 


| Bland and Altman plot | © ms 


国 Drawm ine of cquality (differenoe=W) 
| Orsn ines for 95% C1 of mean of differaces 
同 Oren lnes for 495% £1 of limits cf aoreememt 
Oran regression Ime of differences 

[la5% Confidence Imterwal 


150 
AVERAGE of mEDY and sEDY 


图 26-10 Bland & Altman plot 设置 图 26-11 B-A 图 


如 果 一 种 检测 结果 为 金 标准 的 检测 结果 4， 另 一 种 检测 结果 为 待 评价 方法 检测 的 结 
果 BB， 此 时 还 可 以 构建 以 B 为 Y， 以 4( 金 标准 结果 ) 为 的 直线 回归 方程 。 当 和 斜率 越 
接近 1， 截 距 a 越 接近 0， 说 明 两 种 检测 方法 结果 越 一 致 。 此 部 分 参照 一 元 线性 回归 部 分 
内 容 ， 此 处 不 装 。 
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26.2.6 ”Deming 回 归 


最 小 二 乘 回 归 要 求 式 为 精确 测量 的 变量 ， 无 明显 的 系统 误差 与 随机 误 状 ， 了 为 随机 
变量 。 然 而 现实 中 ， 人 往往 对 也 非 精确 测量 的 变量 ， 也 存在 系统 误 牵 。 如 条 医疗 器 械 公 司 
僻 评 价 每 上 市 的 和 女 仪 右 与 已 经 上 市 的 B 仪 强 之 加 的 一 至 性 ， 可 是 B 仪 器 也 不 是 该 种 检测 
的 金 标 准 , 本 号 也 存在 大 系统 误 产 , 因此 , 这 类 问题 就 不 合适 进行 最 小 二 乘 回归 进行 分 析 ， 
而 应 该 考虑 用 Deming 回归 。 

Deming 回归 为 了 尽量 消除 两 种 检测 方法 的 随机 误 送 ， 需 要 对 每 个 样本 进行 两 次 平行 
测定 。 经 假设 检验 ， 和 斜率 5 接近 1， 截 距 a 接近 0， 说 明 两 种 方法 检测 一 致 性 较 好 。 

案例 实战 

继续 以 例 data26.3 数据 为 例 。 

1. 单 击 Statistics 一 Method Comparison 一 Deming regression 选项 ， 如 图 26-12 所 示 。 

2. 讽 土 : 将 2 种 方法 ， 每 次 2 次 午 复 的 结果 放 入 对 应 框 中 ， 扣 击 “OK” 运 行 即 可 。 


Statstcs | Graphs Tests Sampling Window Halp 
Ummary statistics.. 2 = Bf I 5 [x x | 二 二 


Distribution plot 


Correlation 


Regression | 
5 D 区 用 

T-tests mEDY1 SsEDT2 =sEDV1 
pe 103.25 86.32 86.32 
二 站 让, 83 113d.E5 138. ED 

B69, FO 了 了 本， Tod 
nowa la39,23 -130,19 133,19 
LU as -111d,34 11Y, 4 i 
136, 523 99,29 101,29 Se | Ee 
Survival analysls qa 36 98 dD 88 dD | 区 |Scatter diacram &regression line 


Meta-analysis qg nd 100.25 113. 25 Uplicate， [|Residuals 
serial measurements,.. 129,32| 131,44| 13]1.44 or Cy = 
201,dd 201,50 219,50 | 


Refsrsnce Intcrv 可 | 


Variance ratio test F-test),. 


Categorical data 


| 昌 | 时 昌 
Bland Aliman plot.., 
Mountain plot.., 


Concordance correlation coeftficient... 


Inter-rater agreement (kappa).. 


图 26-12” Deming 回归 图 26-13 Deming 回归 设置 
3. 结果 解读 图 26-14 为 回归 的 结果 ， 得 到 方程 y=6.4648+0.9829X， 和 斜率 越 接 近 1， 
结 未 越 一 致 。 图 26-15 为 回归 图 ， 有 友 现 得 到 的 回归 线 与 参考 线 非 营 吻合， 说 明 一 致 性 较 好 。 
注 : 参考 线 的 科 率 为 1。 图 26-16 为 回归 残 过 图 ， 理 想 残 大 应 该 围绕 参考 线 对 称 分 布 。 
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140 160 
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图 26-16 ”回归线 差 图 


398 | SPSS 实战 与 统计 思维 | 


26.2.7 ”Passing-Bablok 回 归 估 计 


如 果 寞 第 值 较 多 ， 可 选用 Passing-Bablok 回归 ， 即 任 取 两 点 三 定 直线 ， 多 次 反复 ， 
得 到 多 条 直线 的 斜率 ， 然 后 计算 斜率 的 中 位 数 并 进行 调整 。 

到 例 实战 

继续 以 data26.2 为 例 ， 作 为 演示 。 

] Statistics 一 Method Comparison 一 Passing&Bablok regression， 如 图 26-17 所 示 。 

2. 结果 解 谈 : 参照 上 例 即 可 。 


Statistics Graphs Tests Sampling ‘Window Help 
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Y =0.5864 +0.8182 x 
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| dethod comparison | 


Bland & Aliman plot... 


RO curves Mountain plot.. 
Craats tables 
1pb 
17 Intraclass Correlation coefficient.,. 
1 吕 Concordance correlation coefficient.., 
]9 Inter-rater agreement kappa)... 四 
i 
图 26-17 Passing-Bablok 回归 有 订单 图 26-18 ”Passing-Bablok 回归 检验 结果 


5.5 6.0 
仅 妖 BB 


图 26-19 ”Passing-Bablok 回归 图 
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知识 小 结 

(1) 配对 1 检验 、 简 单 相 关 分 析 上 共有 明显 的 片面 性 。 

(2) ICC 同时 考虑 了 随机 误差 和 系统 误差 ， 但 结果 不 具有 临床 实际 意义 ;， 同时 以 
ICC>0.7 进行 判定 也 有 所 武 靳 。 

(3) Bland-Altman 方法 可 作为 评价 一 致 性 的 主要 考虑 ， 但 是 必须 结合 临床 实际 意义 
进行 判断 。 

(4) 不 能 够 通过 单一 方法 评价 定量 指标 的 一 致 性 ， 须 同时 结合 多 种 方法 从 不 同 角 度 


联合 评价 


这 是 本 书 的 后 记 ， 但 已 经 与 前 言 写 作 时 间 相 隔 几 近 一 年 ， 曾 经 吹 过 的 牛 ， 现 在 终于 
可 以 结束 了 ， 松 哥 终于 按照 自己 的 想法 ， 把 这 本 书写 完了 。 在 这 个 不 上 不 下 的 年 龄 ， 也 
许 再 过 两 年 根本 不 敢 奢 想 ， 这 不 仅仅 是 精神 上 的 历练 ,更 是 腰椎 、 有 颈椎、 眼睛 的 折磨 。 嗯 ， 
终于 可 以 结束 了 ! 


长 叹 一 声 ， 如 释 重负 ， 却 没有 姑 币 的 喜 局 。 这 本 书 虽 有 瑕 疫 ， 但 已 经 超出 松 哥 当时 
的 预期 ， 很 多 内 容 都 是 国内 首次 发 布 ， 而 这 点 恰恰 就 是 松 哥 撰 写本 书 的 初衷 之 一 ， 适 当 
改变 一 下 “ 书 到 用 时 翻 不 到 ”的 现状 。 松 哥 也 食 言 了 ， 当 初 说 写 一 本 没有 统计 公式 的 统 
计 书 ， 发 现 那 是 小 概率 事件 ， 但 松 哥 可 以 说 ， 那 些 公 式 只 是 为 了 让 你 理解 ， 而 无 须 记忆 ， 
呵 啊 ! 


统计 学 习 重 思想 ， 软 件 学 习 重 实 成 ， 这 就 是 统计 的 道 与 术 ， 道 术 兼 修之 后 ， 你 就 已 
经 很 历 害 了 ， 但 松 哥 还 希望 你 能 拥有 一 颗 对 数据 的 敬 藤 之 心 ,理解 它 ， 章 重 它 、 善 用 它 ， 
它 才 会 同 你 展示 数据 之 美 ! 数据 是 会 说 话 的 。 曾 经 很 多 次 , 松 哥 在 翻阅 一 些 文章 的 时 候 ， 
里 面 的 数据 癌 松 哥 哭 诉 它 被 践踏 的 遭遇 ， 说 它 原 本 不 是 这 样 的 ， 是 被 屈 打 成 招 的 ! 有 人 
说 “只 要 你 对 数据 严刑 拷打 ， 它 就 会 招供 的 ”， 但 松 哥 不 希望 你 是 那样 的 人 。 


该 说 感谢 了 ! 一 年 中 , 经 第 独 目 果 前 、 黑 夜 孤 灯 写 书 ， 失 去 了 很 多 陪伴 家 人 的 时 间 。 
感谢 我 的 父母 ， 他 们 虽 已 年 到 ， 仍 在 帮 我 照看 孩子 。 感 谢 我 的 妻子 刘 匡 一 年 中 对 家 庭 的 
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照顾 。 感 谢 我 的 两 个 孩子 文博 和 懂 宇 对 我 不 能 障 他 们 玩 儿 的 理解 ! 也 感谢 我 的 肉体 对 驻 
扎 在 他 体内 灵魂 的 理解 与 支持 ! 
学 习 过 程 中 ， 遇 到 问题 可 以 扫 朱 下方 二 维 码 ， 进 行 尺 饥 与 交流 ! 


松 哥 统计 
2018 年 4 月 18 日 
于 安徽 合肥 
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